NTS-CoT: CoT 추론을 활용한 LLM 기반 뉴스 타임라인 요약의 환각 현상 완화
요약
본 논문은 온라인 뉴스 타임라인 요약(TLS)에서 발생하는 환각 현상을 완화하기 위한 새로운 프레임워크 NTS-CoT를 제안합니다. 이 프레임워크는 Element-CoT, Date Selection, Causal-CoT 세 가지 모듈을 활용하여 내용의 충실도와 시간적 정확성을 높입니다. 실험 결과, NTS-CoT가 기존 최첨단 모델 대비 우수한 성능으로 환각 현상을 효과적으로 줄이는 것을 입증했습니다.
핵심 포인트
- NTS-CoT는 CoT 추론 기반의 TLS 개선 프레임워크이다.
- Element-CoT, Date Selection, Causal-CoT 세 가지 모듈로 구성된다.
- 환각 완화 및 시간적 정확성 향상에 기여한다.
- 기존 SOTA 모델 대비 우수한 성능을 보였다.
온라인 뉴스의 빠른 업데이트는 사건 전개 과정을 추적하는 것을 어렵게 만들며, 이는 타임라인 요약(TLS)의 필요성을 강조합니다. LLM이 생성한 내용이 원본 뉴스에서 벗어나는 '환각(Hallucinations)'은 여전히 LLM 기반 TLS에서 중요한 문제로 남아 있지만, 기존 연구에서는 충분히 다루어지지 않았습니다. 이러한 격차를 해소하기 위해, 우리는 두 가지 주요 유형의 환각을 식별했습니다: 뉴스 요약 과정 중 발생하는 부정확한 내용과 날짜-사건 요약에서 발생하는 정보 누락입니다. 이에 저희는 CoT(Chain-of-Thought) 추론을 활용하여 TLS의 환각 현상을 완화하는 새로운 프레임워크인 NTS-CoT를 제안합니다. 이 프레임워크는 세 가지 핵심 모듈로 구성됩니다: i) 충실한 요약을 위해 필수적인 뉴스 요소를 포착하는 Element-CoT, ii) 시간적 중요도와 사건의 두드러짐함을 결합하여 타임스탬프를 선택하는 Date Selection, 그리고 iii) 인과 관계를 추론하고 날짜-사건 요약에서의 누락을 줄이는 Causal-CoT입니다. 세 가지 TLS 벤치마크에 대한 정량적 분석과 인간 평가를 포함한 광범위한 실험을 통해, NTS-CoT가 기존 최첨단 기준(state-of-the-art baselines)보다 우수한 성능을 보이며, 환각 현상을 효과적으로 완화하고 LLM 기반 TLS의 성능을 향상시키는 것을 입증했습니다. 저희 소스 코드는 https://anonymous.4open.science/r/NTS-CoT 에서 이용 가능합니다.
AI 자동 생성 콘텐츠
본 콘텐츠는 arXiv cs.CL (NLP)의 원문을 AI가 자동으로 요약·번역·분석한 것입니다. 원 저작권은 원저작자에게 있으며, 정확한 내용은 반드시 원문을 확인해 주세요.
원문 바로가기