LLM 에이전트의 논문 활용을 위한 조정 규약 paper.json 제안
요약
LLM 에이전트가 학술 논문을 분석할 때 발생하는 세부 주장 인용 오류, 범위 확장, 그림 명령 추출 실패 등의 문제를 해결하기 위해 'paper.json' 규약을 제안합니다. 이 규약은 안정적인 주장 및 정의 ID 제공, 명시적인 미주장 목록, 정확한 그림 셸 명령 등을 포함하며, 인간이 1시간 이내에 수기로 작성할 수 있는 최소한의 준수성을 목표로 합니다.
핵심 포인트
- LLM 에이전트의 논문 분석 시 발생하는 반복적인 실패 사례(주장 인용 오류, 범위 확장 등) 식별
- 안정적인 주장(C1) 및 정의(C5) ID, 명시적 미주장 목록(C2), 정확한 그림 명령(C3)을 포함하는 paper.json 규약 제안
- 인간 작성자가 논문 본문을 수정하지 않고도 1시간 이내에 JSON을 작성할 수 있는 최소 실행 가능 준수성(MVC) 강조
- 제안된 규약의 유효성을 검증하기 위한 validator.py 도구 제공
LLM 에이전트 (LLM agents)는 학술 논문의 첫 번째(때로는 유일한) 독자로서 세부 주장(sub-claims)을 훑어보고, 재현 단계(reproducibility steps)를 추출하며, 연구 범위를 일반화하는 역할을 일상적으로 수행합니다. 하지만 표준적인 산문 형태의 논문들은 이러한 역할 수행 시 반복적인 실패를 야기합니다. 즉, 논문의 세부 단위로 인용할 수 없는 세부 주장, 논문이 테스트한 범위를 벗어난 범위 확장(scope overextension), 그리고 논문 자체가 아닌 코드베이스에 파묻혀 있는 그림 명령(figure commands) 등이 그 예입니다.
우리는 PDF와 함께 제공되는 동반 JSON 파일인 paper.json을 제안하며, 경량화된 규약(convention)을 통해 이러한 실패 사례들을 해결합니다: 안정적인 주장 ID (C1), 명시적인 미주장 목록 (C2), 그림별 정확한 셸 명령 (C3), 그리고 안정적인 정의 ID (C5)입니다. 다섯 번째 규약 (C4)은 인간이 읽을 수 있는 출력물(논문 본문)을 수정하지 않고도, 완성된 논문에 대해 PDF와 함께 수기로 작성된 JSON을 통한 최소 실행 가능 준수(minimum viable compliance)가 1시간 이내에 가능하다는 점을 명시합니다. C1, C2, C3, C5는 개방적인 제안입니다. 규약을 준수하는 논문을 읽고 행동하는 에이전트는 이 규약들에 대한 찬성 또는 반대의 증거를 생성하게 됩니다. 본 논문 자체도 규약을 준수하고 있습니다: uv run validator.py paper.json --against paper.typ 명령이 통과됩니다. 저장소: https://github.com/arquicanedo/paper-json
AI 자동 생성 콘텐츠
본 콘텐츠는 arXiv cs.AI의 원문을 AI가 자동으로 요약·번역·분석한 것입니다. 원 저작권은 원저작자에게 있으며, 정확한 내용은 반드시 원문을 확인해 주세요.
원문 바로가기