본문으로 건너뛰기

© 2026 Molayo

arXiv논문2026. 06. 25. 11:47

형식적 사고의 직조 (Weave of Formal Thought)

요약

LLM의 코드 생성 시 구문적 유효성을 보장하기 위해 형식 엔진과 학습된 구조적 표현을 결합한 WoFT 프레임워크를 제안합니다. GLR 파싱 기반의 제약된 디코딩과 잠재 변수 미세 조정을 통해 모델이 문법 구조를 직접 활용하도록 설계되었습니다.

핵심 포인트

  • GLR 파싱 기반의 투기적 어휘 분석을 통한 엄격한 구문 검증
  • 비단말 문법 기호를 생성 과정에 포함하는 잠재 변수 미세 조정
  • RWS 알고리즘을 활용한 적응형 구조적 연습장 학습
  • StarCoder2-3B 적용 시 Python 코드 생성 성능(Cross-entropy) 14.3% 개선

대규모 언어 모델 (LLMs)은 코드에 대해 놀라운 표면적 유창성 (surface fluency)을 달성하지만, 출력물의 구문적 유효성 (syntactic validity)을 형식적으로 보장하지 못하며 대상 언어를 정의하는 계층적 구조 (hierarchical structure)를 활용하지도 못합니다. 기존의 제약된 디코딩 (constrained-decoding) 프레임워크는 전자를 다루지만, 문맥 민감적 어휘 분석 (context-sensitive lexing), 최대 일치 토큰화 (maximal-munch tokenization), 키워드 추출 (keyword extraction)을 포함한 중요한 어휘 메커니즘을 배제하는 경직된 가정 하에 작동하며, 어휘 마스킹 (vocabulary masking)을 근사적으로만 수행하여 완전성 (completeness)을 희생합니다. 후자의 경우, 코드 LLM은 어떤 구조적 정보를 노출할지 학습하기보다는 미리 결정된 정책을 통해 문법적 구조를 주입합니다. 본 연구에서는 엄격한 구문 검증과 학습된 구조적 표현 (structural representations)을 결합하는 패러다임인 Weave of Formal Thought (WoFT)를 소개합니다. 첫째, 우리는 전체 Tree-sitter 사양에 대해 건전성 (sound)과 완전성 (complete)을 갖춘 형식 엔진 (formal engine) 및 제약된 디코더 (constrained decoder)를 제시합니다. GLR 그래프 구조 스택 (graph-structured stack)과 동기화된 동시적 어휘 분석기 상태 가설 (concurrent lexer-state hypotheses)을 유지하는 투기적 어휘 분석 (speculative-lexing) 구조로 일반화된 LR (GLR) 파싱을 증강함으로써, 우리의 디코더는 유효한 프로그램 접두사 (program prefix)로 확장되는 모든 서브워드 토큰 (subword token)을 허용하고 그 외의 모든 토큰은 거부합니다. 둘째, 언어 모델이 생성 과정에 비단말 문법 기호 (non-terminal grammar symbols)를 직접 끼워 넣도록 훈련하는 잠재 변수 미세 조정 (latent-variable fine-tuning) 방법을 제시합니다. 표면 텍스트의 중요도 가중 증거 하한 (importance-weighted evidence lower bound, IW-ELBO)을 최적화하기 위해 재가중 웨이크-슬립 (reweighted wake-sleep, RWS) 알고리즘을 활용하여, 모델은 형식적 유도 (formal derivations)를 적응형 구조적 연습장 (adaptive structural scratchpad)으로서 선택적으로 유지하는 법을 학습합니다. Python의 경우, 우리의 RWS 목적 함수로 StarCoder2-3B를 미세 조정했을 때 텍스트 전용 SFT 베이스라인 대비 토큰당 교차 엔트로피 (cross-entropy)를 14.3% 감소시켰으며, 이는 재량적 잠재 구문 (discretionary latent syntax)이 평면적 자기회귀 훈련 (flat autoregressive training)이 버리는 중요한 구조적 정보를 회복함을 입증합니다.

AI 자동 생성 콘텐츠

본 콘텐츠는 arXiv cs.AI의 원문을 AI가 자동으로 요약·번역·분석한 것입니다. 원 저작권은 원저작자에게 있으며, 정확한 내용은 반드시 원문을 확인해 주세요.

원문 바로가기
0

댓글

0