본문으로 건너뛰기

© 2026 Molayo

arXiv논문2026. 06. 15. 07:22

대화 맥락 기반 증분 압축을 통한 다중 턴 대화 생성

요약

본 논문은 장기 다중 턴 대화에서 발생하는 누적된 비용과 정보 손실 문제를 해결하기 위해 Context-Driven Incremental Compression (C-DIC)을 제안합니다. C-DIC는 대화를 수정 가능한 맥락적 스레드로 간주하고, 경량의 검색-수정-쓰기 백 루프를 통해 메모리를 업데이트하여 장기 행동 안정성을 높입니다. 또한, TBPTT를 조정하여 턴 간 의존성 학습을 개선했습니다.

핵심 포인트

  • C-DIC는 대화를 맥락적 스레드로 보고 수정 가능한 방식으로 압축합니다.
  • 검색(retrieve), 수정(revise), 쓰기 백(write-back) 루프가 메모리 업데이트에 사용됩니다.
  • 장문 대화 벤치마크에서 안정적인 추론 지연 시간과 낮은 퍼플렉서티를 입증했습니다.

현대의 대화 에이전트는 각 턴마다 점점 길어지는 대화 기록에 의존하며, 이는 대화 길이가 늘어남에 따라 증가하는 중복적인 어텐션 및 인코딩 비용을 초래합니다. 단순한 잘라내기(truncation)나 요약은 충실도(fidelity)를 저하시키고, 기존의 맥락 압축기는 턴 간 메모리 공유나 수정 기능이 부족하여 정보 손실과 장기 대화에서 누적되는 오류를 유발합니다. 우리는 대화 역학 하에서의 맥락 압축을 재검토하고 그 취약성을 경험적으로 제시합니다. 효율성과 견고성(robustness)을 모두 개선하기 위해, 우리는 Context-Driven Incremental Compression (C-DIC)을 도입했습니다. 이는 대화를 교차하는 맥락적 스레드(contextual threads)로 간주하고, 수정 가능한(revisable) 각 스레드의 압축 상태를 단일하고 간결한 대화 메모리에 저장합니다. 매 턴마다 경량의 검색(retrieve), 수정(revise), 쓰기 백(write-back) 루프가 턴 전반에 걸쳐 정보를 공유하고 오래된 기억을 업데이트하여, 장기 지평선 행동(long-horizon behavior)을 안정화합니다. 또한, 우리는 단축 역전파를 통한 시간(truncated backpropagation-through-time, TBPTT)을 다중 턴 설정에 맞게 조정하여, 전체 기록에 대한 역전파 없이도 턴 간 의존성을 학습하게 합니다. 장문 대화 벤치마크에서의 광범위한 실험은 C-DIC의 우수한 성능과 효율성을 입증했습니다. 특히, C-DIC는 수백 번의 대화 턴에 걸쳐 안정적인 추론 지연 시간(inference latency)과 퍼플렉서티(perplexity)를 보여주며, 고품질 대화 모델링을 위한 확장 가능한 경로를 지원합니다.

AI 자동 생성 콘텐츠

본 콘텐츠는 arXiv cs.CL (NLP)의 원문을 AI가 자동으로 요약·번역·분석한 것입니다. 원 저작권은 원저작자에게 있으며, 정확한 내용은 반드시 원문을 확인해 주세요.

원문 바로가기
0

댓글

0