제약된 증거 선택을 통한 주제-타임스탬프 정렬
요약
회의 기록 검색 시 주제와 타임스탬프를 정확히 정렬하기 위한 새로운 연구를 소개합니다. LLM이 임의의 시간을 생성하는 대신, 검색된 후보군 중에서 최적의 시간을 선택하는 '제약된 후보 선택' 방식을 통해 정확도를 높였습니다.
핵심 포인트
- 주제-타임스탬프 정렬을 위한 제약된 시간 후보 선택 방식 제안
- LLM의 환각 현상을 방지하기 위해 시간 코드 생성을 후보 선택으로 재구성
- Mistral-7B-Instruct 사용 시 Recall@5가 31.9%에서 50.0%로 향상
- 검색 품질과 출력 설계가 긴 전사 데이터의 시간적 근거 설정에 핵심적임
사용자가 논의된 내용은 기억하지만 언제 논의되었는지는 기억하지 못할 때, 회의 기록(Meeting archives)을 검색하는 것은 어렵습니다. 우리는 주제-타임스탬프 정렬(topic-to-timestamp alignment)을 연구합니다. 즉, 자연어 주제와 타임스탬프가 포함된 회의 전사(transcript)가 주어졌을 때, 해당 주제가 논의된 시간을 반환하는 것이 목표입니다. 표준적인 RAG(Retrieval-Augmented Generation) 설정은 관련 전사 발췌본을 검색할 수 있지만, 여전히 언어 모델(Language Model)에게 타임스탬프를 생성하도록 요청하며, 이는 근거가 없거나 유효하지 않은 시간 코드(timecodes)를 생성할 수 있습니다. 따라서 우리는 타임스탬프 예측을 제약된 시간 후보 선택(constrained temporal candidate selection)으로 재구성합니다. 시스템은 타임스탬프가 포함된 전사 청크(chunks)를 검색하고, 모델은 시간 코드를 생성하는 대신 주제를 가장 잘 뒷받침하는 후보를 선택합니다. 200개의 지방 의회 회의 전사에서 추출한 420개의 주제-타임스탬프 쿼리에 대해 실험한 결과, Mistral-7B-Instruct를 사용했을 때 Recall@5가 31.9%에서 50.0%로 증가하였고, MAE(Mean Absolute Error)는 837.0초에서 761.0초로 감소했으며, 파싱 가능한 출력(parseable outputs)의 수는 420개 쿼리 중 373개에서 419개로 증가했습니다. 이러한 결과는 긴 전사에서의 시간적 근거 설정(temporal grounding)이 단순히 언어 모델의 선택뿐만 아니라, 검색 품질과 출력 설계에 크게 의존한다는 것을 시사합니다.
AI 자동 생성 콘텐츠
본 콘텐츠는 arXiv cs.CL (NLP)의 원문을 AI가 자동으로 요약·번역·분석한 것입니다. 원 저작권은 원저작자에게 있으며, 정확한 내용은 반드시 원문을 확인해 주세요.
원문 바로가기