템플릿 제약 조건이 있는 LaTeX 변환을 위한 이중 트랙 프레임워크
요약
Markdown 초안을 템플릿 제약 조건이 있는 LaTeX로 변환하기 위한 이중 트랙 프레임워크를 제안합니다. LLM의 추론 능력과 규칙 기반 엔진의 결정론적 처리를 결합하여 구조적 충실도를 높이고 환각 현상을 최소화합니다.
핵심 포인트
- 템플릿 제약 조건과 문서 처리를 분리하는 이중 트랙 구조 도입
- LLM은 복잡한 레이아웃 및 메타데이터 처리에만 제한적으로 사용
- 규칙 기반 엔진을 통해 결정론적이고 안정적인 변환 수행
- 기존 방식 대비 높은 컴파일 성공률과 구조적 충실도 입증
고급 문서 변환에 대한 요구가 증가함에 따라, 구조화된 Markdown 초안을 LaTeX와 같이 템플릿을 준수하는 형식으로 매핑하는 것은 여전히 어려운 과제로 남아 있습니다. 기존의 접근 방식은 주로 결정론적인 규칙 기반 변환기(rule-based converters) 또는 순수 엔드 투 엔드 대규모 언어 모델 (LLM) 생성에 의존합니다. 전자는 자산 삽입 및 템플릿 특유의 제약 조건을 올바르게 처리하지 못하며, 후자는 의미적 드리프트 (semantic drift)를 유발하여 디버깅하기 어려운 환각 (hallucinations)을 일으키는 경향이 있습니다. 이러한 한계를 해결하기 위해, 우리는 템플릿 포맷팅과 문서 처리를 체계적으로 분리하는 견고한 이중 트랙 프레임워크 (Dual-Track Framework)를 소개합니다. 오프라인 트랙은 템플릿 제약 조건을 재사용 가능한 매니페스트 (manifest)로 추출하며, 온라인 트랙은 하이브리드 실행 파이프라인을 구현합니다. 이 파이프라인은 LLM의 사용을 추론 집약적인 구성 요소(예: 의미론적 메타데이터, 참고 문헌, 복잡한 시각적/표 레이아웃)에만 독점적으로 제한하는 한편, 결정론적 처리를 위해 규칙 기반 엔진 (rule-based engines)에 위임합니다. 7개의 LaTeX 템플릿과 56편의 출판된 연구 논문을 대상으로 한 실증적 평가 결과, 우리의 방법은 이전의 베이스라인 (baselines)과 비교하여 더 나은 구조적 충실도를 보존하고, 다양한 레이아웃 제약 조건을 충족하며, 더 높은 컴파일 성공률을 달성함을 입증했습니다.
AI 자동 생성 콘텐츠
본 콘텐츠는 arXiv cs.CL (NLP)의 원문을 AI가 자동으로 요약·번역·분석한 것입니다. 원 저작권은 원저작자에게 있으며, 정확한 내용은 반드시 원문을 확인해 주세요.
원문 바로가기