Visored: LLM이 생성한 수학을 위한 제어된 자연어 증명기 (Controlled-Natural-Language Prover)
요약
LLM과 인간의 수학 작성 방식을 결합한 의존 타입 기반의 새로운 증명기 Visored를 소개합니다. 수학적 자연어를 모방하는 표면층과 규칙 기반 자동화 계층을 통해 Lean 및 Rocq 시스템을 보완하며, 검증된 Lean 파일 출력이 가능합니다.
핵심 포인트
- 의존 타입 기반의 제어된 자연어 증명기 설계
- 수학적 자연어 모방 표면층과 규칙 기반 자동화 계층 결합
- 승인된 증명을 Lean 파일로 변환 및 출력 가능
- 전용 학습 데이터 없이도 miniF2F 벤치마크에서 효과적 성능 입증
우리는 LLM(Large Language Models)과 인간이 수학을 작성하는 방식에 맞춰 설계된 의존 타입 기반(dependent-type-based) 증명기를 제시하며, 이는 Lean 및 Rocq와 같은 기존 시스템을 보완합니다. 이 시스템의 핵심 설계 선택 사항은 수학적 자연어(mathematical natural language)를 모방하는 표면층(surface)과, 교과서에서 생략될 법한 일상적인 단계들을 처리하는 규칙 기반 자동화 계층(rule-driven automation layer)입니다. 이를 통해 승인된 증명은 검증된 Lean 파일로 다시 출력될 수 있습니다. 초기 실험 결과에 따르면, 증명기 전용 학습 데이터가 없는 상태에서도 LLM은 miniF2F 벤치마크에서 이를 효과적으로 사용하는 법을 배울 수 있음을 시사합니다. Lean 출력 발췌본: https://github.com/xiyuzhai-husky-lang/visored/
AI 자동 생성 콘텐츠
본 콘텐츠는 arXiv cs.PL (Programming Languages)의 원문을 AI가 자동으로 요약·번역·분석한 것입니다. 원 저작권은 원저작자에게 있으며, 정확한 내용은 반드시 원문을 확인해 주세요.
원문 바로가기