arXiv논문2026. 05. 05. 13:05

장기 보관된 루틴 샘플을 활용한 AI 기반 전단 모델의 전립선 병리 검증

요약

본 연구는 장기간 보존된 전립선 생검 코어 샘플을 활용하여 AI 기반의 전립선 병리 검증 모델인 GleasonAI를 평가했습니다. 이 모델은 1998년부터 2015년까지 수집된 데이터를 사용하여 개발되었으며, 코어 수준 ISUP 등급에 대해 높은 일관성(quadratic-weighted kappa 0.86)을 달성하며 우수한 성능을 보였습니다. 특히, 장기간의 시간적 변이에도 불구하고 안정적인 성능을 유지하여 AI 모델의 일반화 가능성을 입증했으며, 병리 보관소 데이터를 대규모 연구 자원으로 활용할 잠재력을 제시했습니다.

핵심 포인트

AI 기반 전립선 병리 검증 모델(GleasonAI)이 장기 보존된 생검 코어 샘플을 사용하여 성공적으로 평가되었다.
모델은 1998년~2015년의 데이터를 활용하여 ISUP 등급에 대해 높은 일관성(kappa 0.86)을 달성했다.
장기간 보존된 자료를 사용했음에도 불구하고 모델 성능이 안정적으로 유지되어 시간적 변이에 대한 견고성을 입증했다.
연구 결과는 병리 보관소 데이터를 대규모 AI 개발, 검증 및 역향예후 연구에 활용할 수 있는 잠재력을 보여준다.

인공지능 (AI) 은 전립선 병리의 임상 도구로 자리 잡고 있지만, 시료 준비 및 장기 보존에 따른 변이ข้าม 일반화 문제는 여전히 잘 이해되지 않았습니다. 우리는 스웨덴 14 개 지역의 1,028 명의 환자에서 채취한 10,366 개의 생검 코어를 포함한 독립적 검증 집단을 사용하여 GleasonAI 를 평가했습니다. GleasonAI 는 장기 보관 진단 시료를 사용한 프로모르트 (ProMort) 집합체에서 수집된 1998 년~2015 년 데이터를 기반으로 한 엔드 투 엔드 (end-to-end) 주의 기반 다중 인스턴스 학습 모델입니다. 이 모델은 코어 수준의 ISUP 등급에 대해 전체적 제곱 가중치 카파 (quadratic-weighted kappa) 를 0.86 으로 달성했으며, 이는 몇몇 경륜 있는 병리학과 일치하며 지리적 지역을 통해 일관된 결과를 보였습니다. 특히 성능은 17 년간 수집 기간 동안 안정적으로 유지되었으며, 이는 보관 자료의 시간 관련 변이에 대한 견고함을 입증했습니다. 이러한 특성은 기반 모델 (foundation model) 기반 접근법에서 일관되게 관찰되지 않았으며, 탐구 분석을 통해 전립선 암 특이 사망에 대해 AI 부여 등급 그룹 간 유의미한 예후 기울기를 보였습니다. 이러한 결과는 AI 등급 모델의 일반화 가능성을 지지하며 병리 보관소 (pathology archives) 를 대규모 AI 개발, 검증 및 역향예후 연구 (retrospective prognostic research) 자원으로 활용할 잠재력을 입증했습니다.

AI 자동 생성 콘텐츠

원문 바로가기

장기 보관된 루틴 샘플을 활용한 AI 기반 전단 모델의 전립선 병리 검증

요약

핵심 포인트

댓글