EGTR-Review: 멀티 에이전트 교사 증류를 통한 효율적인 근거 기반 과학 논문 피어 리뷰 생성
요약
EGTR-Review는 멀티 에이전트 교사 증류 기술을 활용하여 근거 기반의 과학 논문 피어 리뷰를 생성하는 프레임워크입니다. 복잡한 멀티 에이전트 시스템의 높은 비용 문제를 해결하기 위해 중간 추론 궤적을 경량화된 학생 모델로 증류하여 효율성을 높였습니다.
핵심 포인트
- 멀티 에이전트 교사 증류를 통한 고성능·저비용 리뷰 생성
- 구조 인식 논문 분해 및 외부 학술 증거 검색 프로세스 도입
- 증거 가중 목적 함수로 검증 불가능한 감독 영향 최소화
- 기존 베이스라인 대비 높은 사실적 근거 및 출처 추적성 확보
- 토큰 소비량과 추론 시간을 실질적으로 단축
과학적 피어 리뷰 (Scientific peer review) 생성은 리뷰 부담을 줄이고 적시에 피드백을 제공한다는 점에서 점점 더 많은 관심을 받고 있습니다. 그러나 기존의 거대 언어 모델 (LLM) 기반 방법들은 증거 지원이 불충분하고 출처 추적성 (source traceability)이 약한 일반적인 의견만을 생성하는 경우가 많으며, 복잡한 멀티 에이전트 (multi-agent) 시스템은 높은 추론 비용을 발생시킵니다. 이러한 과제를 해결하기 위해, 우리는 멀티 에이전트 교사 증류 (Multi-Agent Teacher Distillation)를 통한 근거 기반 및 추적 가능한 리뷰 생성 프레임워크인 EGTR-Review를 제안합니다. EGTR-Review는 먼저 구조 인식 논문 분해 (structure-aware paper decomposition), 핵심 요소 추출 (key-element extraction), 외부 학술 증거 검색 (external scholarly evidence retrieval), 증거 상태 라벨링 (evidence-state labeling), 검증 추론 (verification reasoning), 그리고 리뷰 합성 (review synthesis)을 수행하는 멀티 에이전트 교사를 구축합니다. 그 다음, 작업 접두사 기반 멀티태스크 학습 (task-prefix-driven multi-task learning)을 통해 중간 추론 궤적 (intermediate reasoning trajectories)과 최종 리뷰 의견을 경량화된 학생 모델 (student model)로 증류합니다. 증거 가중 목적 함수 (evidence-weighted objective)는 약하거나 누락되었거나 검증 불가능한 감독 (supervision)의 영향을 더욱 감소시킵니다. 공개 피어 리뷰 데이터셋에 대한 실험 결과, EGTR-Review (Student)는 자동화된 지표, LLM-as-Judge 평가, 그리고 인간 평가 전반에서 강력한 프롬프트 기반, 미세 조정 (fine-tuned), 구조적/에이전트 기반 베이스라인 모델들을 능가하는 성능을 보여주었습니다. 동시에 토큰 소비량과 추론 시간을 실질적으로 낮추면서도 강력한 사실적 근거 (factual grounding)와 출처 추적성을 유지합니다. 우리의 코드, 프롬프트, 설정 및 샘플 데이터는 GitHub에서 확인할 수 있습니다.
AI 자동 생성 콘텐츠
본 콘텐츠는 arXiv cs.CL (NLP)의 원문을 AI가 자동으로 요약·번역·분석한 것입니다. 원 저작권은 원저작자에게 있으며, 정확한 내용은 반드시 원문을 확인해 주세요.
원문 바로가기