미국 캘리포니아주립대 샌프란시스코 캠퍼스(UCSF)
AI(인공지능)에 응급의료기관을 찾아온 환자의 상태에 따른 치료 우선순위를 물었더니, 인간 의사보다 정확도가 높은 답변을 내놨다. 연구팀은 급박하게 돌아가는 응급실에서 빠르게 의사 결정을 내려야 할 때, 이런 AI를 유용하게 활용할 수 있을 것으로 내다봤다.
미국 캘리포니아주립대 샌프란시스코캠퍼스(UCSF) 연구팀은 7일(현지시간) 이같은 연구 결과를 국제 학술지 ‘미국의사협회저널(JAMA) 네트워크 오픈’에 발표했다.
연구팀은 병원 응급실에 방문한 성인 환자 25만 1000여명의 익명 임상 기록을 GPT-4 LLM(거대언어모델)에 학습시켰다. 이어 AI 모델이 임상 기록에서 환자의 증상을 정확히 추출하고, 해당 증상의 위급한 정도를 판단할 수 있는지 확인했다.
이어 AI가 내놓은 분석 결과를 기존 응급의료기관에서 활용하는 ‘응급 중증도 지수(ESI·Emergency Severity Index)’와 비교했다. ESI는 1990년대 후반 하버드 의대에서 개발해 응급의료기관에서 활용 중인 5단계 지표다. 응급 환자의 진찰과 치료가 필요한 환자를 식별하는 데 활용한다.
1단계에선 생명이 위협받는 수준이어서 즉각적인 치료가 필요한 환자를 골라낸다. 2단계에선 환자가 고위험군에 속하는지, 급성 증상을 보일 가능성이 있는지, 감각을 상실한 상태인지 등을 확인해 대기 시간을 판단한다. 1~2단계에 포함되지 않을 경우 환자가 기다리는 동안 응급실에서 받을 수 있는 가용 자원을 파악하고, 응급조치가 필요하지 않은 환자를 분류하는 식이다.
연구팀은 뇌졸중처럼 응급조치가 필요한 환자 1명과 손목 골절 등 상대적으로 덜 긴급한 환자 1명을 한 쌍으로 묶은 데이터 샘플을 총 2만 쌍 제작했다. 이를 AI에 학습시켜, 환자의 증상만 고려할 때 두 환자 중 더 급하게 치료받아야 하는 환자가 누구인지 AI가 식별하도록 했다.
그 결과, AI는 응급 중증도 지수에 따라 89%의 정확도로 응급 환자를 식별해냈다. 또 인간 의사와 AI에 같은 데이터 샘플 500쌍을 제시하고 응급 환자를 구별하게 한 뒤 정확도를 평가했다. 이때 AI는 88%의 정확도를, 인간 의사는 86%의 정확도를 보였다.
이번 연구는 시뮬레이션 시나리오가 아닌 실제 병원에서의 임상 데이터를 활용해 AI가 환자의 상태를 판단할 수 있는지 평가한 첫 사례다. 응급실 환자 데이터를 활용한 것도 이번이 처음이다.
연구팀은 “AI의 도움을 받아 가장 심각한 상황의 환자를 치료하는 데 더 많은 시간을 할애할 수 있을 것”이라며 이번에 개발한 AI 모델을 “긴급한 요청을 여러 건 처리해야 하는 상황에서 활용할만한 의사 결정 도구”라고 정의했다. 또 “성별, 인종에 따른 데이터의 편향성은 여전히 극복해야 할 지점”이라고 덧붙였다.
댓글0