Harvard Medical School, AI가 실제 응급실 환자를 진단할 때 발생하는 현상을 테스트하다

요약

Harvard Medical School의 연구에 따르면 OpenAI o1 모델이 응급실 환자의 텍스트 기록만으로 인간 의사보다 빠르게 치명적인 감염을 식별했습니다. AI는 실제 임상 데이터에서 의사보다 높은 진단 및 처치 결정 정확도를 보이며 의료 분야의 혁신적 변화를 예고했습니다.

핵심 포인트

OpenAI o1 모델이 텍스트 기반 진단에서 인간 의사를 능가함
응급실 환자 76명 대상 테스트 결과 AI 진단 정확도 67.1% 기록
처치 결정 측면에서 AI(89%)가 임상 문헌 활용 의사(34%)보다 우세
임상적 추론 방식과 AI 모델 추론 방식의 근본적 차이 존재

Harvard Medical School은 AI가 실제 응급실 (Emergency Room) 환자를 진단할 때 어떤 일이 발생하는지 테스트했습니다.

한 환자가 보스턴의 Beth Israel Deaconess Medical Center에 일반적인 호흡기 증상으로 내원했습니다. 최근 장기 이식을 받았으며, 면역이 억제된 (Immunosuppressed) 상태였습니다. 의사들은 이를 표준적인 사례로 취급했습니다.

AI는 살을 파먹는 감염 (flesh-eating infection)을 포착했습니다.

인간 의사들이 의심을 품기 12~24시간 전에 AI는 이미 이를 식별해 냈습니다. 환자는 응급 수술이 필요했습니다. AI가 차트에 적힌 텍스트만으로 이를 가장 먼저 발견한 것입니다.

이것은 가설이 아닙니다. 2026년 4월 30일 Science에 발표된 내용입니다. 주저자는 Peter Brodeur와 Thomas Buckley이며, 공동 교신 저자 (co-senior authors)는 Harvard Medical School의 Arjun Manrai와 Beth Israel의 Adam Rodman입니다. 그들이 테스트한 모델은 OpenAI o1이었습니다.

그들은 Beth Israel의 실제 응급실 환자 76명을 대상으로 테스트를 진행했습니다. 교과서적인 사례가 아니라, 실제 병원을 찾아온 실제 사람들이었습니다.

정보가 가장 부족한 분류 (triage) 단계에서, AI는 67.1%의 확률로 정확한 진단을 내렸습니다. 첫 번째 담당 의사 (attending)는 55.3%, 두 번째 담당 의사는 50.0%를 기록했습니다. AI는 영상 자료 (imaging)나 신체 검사 (physical exam), 환자 응대 (bedside manner) 없이 오직 전자 건강 기록 (electronic health records)에 적힌 텍스트만을 사용했습니다.

처치 결정 (management decisions) 측면에서 AI는 중앙값 89%를 기록했습니다. UpToDate와 모든 임상 참고 문헌을 사용하는 의사들은 34%를 기록했습니다.

New England Journal of Medicine이 발표한 역대 가장 까다로운 진단 사례 100가지에 대해, AI는 거의 80%의 확률로 정확한 진단을 포함했습니다.

2025년 기준으로, 전 세계 의사와 간호사 5명 중 1명은 이미 복잡한 사례에 대한 제2 의견 (second opinion)을 얻기 위해 AI를 사용하고 있습니다. 절반 이상이 사용하기를 원합니다.

여기서부터 논쟁이 시작됩니다.

해당 연구에 참여하지 않은 Harvard Medical School의 한 연구원은 다음과 같이 말했습니다. "우리가 임상적 추론 (clinical reasoning)이라고 말할 때, 그것은 모델의 추론 (model reasoning)과 같은 의미가 아닙니다. 이 모델들은 우리가 추론이라고 부르는 순차적 사고를 하도록 최적화되어 있지만, 우리가 의대생들에게 추론하는 법을 가르치는 방식과는 전혀 다릅니다."

AI는 맥박을 느끼지 못합니다. 목소리에 담긴 망설임을 듣지 못합니다. 환자가 말하지 않은 것을 알아차리지도 못합니다. AI는 텍스트를 처리할 뿐입니다.

그리고 AI는 그 텍스트를 작성한 인간들보다 더 정확했습니다.

Harvard의 수석 연구원인 Arjun Manrai는 이를 명확하게 말했습니다. "우리는 의학을 재편할 기술의 매우 심오한 변화를 목격하고 있습니다." 그러고 나서 그는 AI 스스로는 말할 수 없는 문장을 덧붙였습니다. "인간은 도전적인 치료 결정 과정에서 인간이 자신들을 안내해주기를 원합니다."

이제 질문은 AI가 당신을 진단할 수 있는지 여부가 아닙니다. AI는 할 수 있습니다. 질문은 당신이 AI가 그러기를 원하는가 하는 것입니다.

AI 자동 생성 콘텐츠

원문 바로가기

Harvard Medical School, AI가 실제 응급실 환자를 진단할 때 발생하는 현상을 테스트하다

요약

핵심 포인트

댓글