Automated Clinical Report Generation for Remote Cognitive Remediation:
요약
본 논문은 원격 인지 재활 세션의 대량 상호작용 데이터로부터 자동화된 임상 보고서를 생성하는 두 가지 접근법(규칙 기반 템플릿 시스템과 LLM 기반 접근법)을 비교합니다. 연구는 이 두 시스템이 임상 신뢰성, 일관성, 그리고 언어적 유창성 측면에서 어떤 트레이드오프를 보이는지 평가했습니다. 결과적으로, 템플릿 기반 시스템은 구조화된 보고서 작성에 강점을 보였으나, LLM은 더 간결하고 자연스러운 출력을 생성하는 것으로 나타났습니다.
핵심 포인트
- 원격 인지 재활 환경에서 자동 임상 보고서 생성이 중요한 과제이며, 이는 언어치료사 부족 문제와 관련이 있습니다.
- 규칙 기반 템플릿 시스템은 높은 임상 신뢰성, 일관성 및 추적성을 제공하여 구조화된 의료 문서에 적합합니다.
- LLM(예: GPT-4) 기반 접근법은 더 유창하고 간결한 자연어 출력을 생성하는 데 강점을 보입니다.
- 임상 보고 시스템 설계 시에는 임상 신뢰성(구조화)과 언어적 품질(유창성) 사이의 트레이드오프를 고려해야 합니다.
- 본 연구는 저자원이 있는 환경의 임상 NLG에 대한 재현 가능한 방법론을 제시하며, 생성형 AI의 책임 있는 의료 채택에 기여합니다.
인지 재활 치료에 대한 수요 증가와 언어치료사 부족으로 인해 원격 재활 도구의 채택이 가속화되었습니다. 이러한 시스템은 클리닉진이 효율적으로 검토하기 어려운 대량의 상호작용 데이터를 생성합니다. 본 논문은 저자원이 없는 환경에서 아바타를 안내한 가정 기반 인지 재활 세션의 자동화된 임상 보고서 생성을 조사합니다. 우리는 두 가지 접근법을 제시하고 비교합니다: (1) 언어 치료 도메인 지식을 명시적인 결정 규칙과 검증된 템플릿으로 인코딩하는 규칙 기반 템플릿 시스템, 이는 임상 신뢰성과 추적성을 보장합니다; 그리고 (2) 더 유창하고 간결한 출력을 목표로 하는 0-shot LLM 기반 접근법 (GPT-4). 두 시스템 모두 동일한 사전 추출된 전문가 검증 구조 변수를 사용하여 통제된 사실적 비교가 가능합니다. 출력은 8명의 언어치료사와 졸업생이 9 가지 기준 질문지를 사용하여 평가했습니다. 결과는 임상 신뢰성과 언어적 품질 사이의 명확한 트레이드 오프를 보여줍니다. 템플릿 기반 시스템은 유동성, 일관성, 결과 제시에서 더 높은 점수를 얻었으며, GPT-4 는 더 간결한 출력을 생성했습니다. 평가 차원에 걸쳐 방향성은 일관되지만, 교정 후 통계적 유의성을 달성하지 않은 것은 전문가 임상 평가의 규모 제한을 반영합니다. 평가자 피드백에 기반하여, 우리는 원격 재활 환경의 임상 보고 시스템에 대한 8 가지 설계 권고를 도출했습니다. 더 넓게는, 이 작업은 저자원이 있는 환경의 임상 NLG 에서 전문가 유도, 분류학 기반 생성, 다차원 인간 평가를 결합하는 재현 가능한 방법론을 기여하며, 통제된 비교가 의료에서 생성형 AI 의 책임 있는 채택에 어떻게 정보를 제공하는지 보여줍니다.
AI 자동 생성 콘텐츠
본 콘텐츠는 arXiv cs.CL의 원문을 AI가 자동으로 요약·번역·분석한 것입니다. 원 저작권은 원저작자에게 있으며, 정확한 내용은 반드시 원문을 확인해 주세요.
원문 바로가기