본문으로 건너뛰기

© 2026 Molayo

arXiv논문2026. 06. 17. 10:37

Visored: LLM이 생성한 수학을 위한 제어된 자연어 증명기 (Controlled-Natural-Language Prover)

요약

LLM과 인간의 수학 작성 방식을 결합한 의존 타입 기반의 새로운 증명기 Visored를 소개합니다. 수학적 자연어를 모방하는 표면층과 규칙 기반 자동화 계층을 통해 Lean 및 Rocq 시스템을 보완하며, 검증된 Lean 파일 출력이 가능합니다.

핵심 포인트

  • 의존 타입 기반의 제어된 자연어 증명기 설계
  • 수학적 자연어 모방 표면층과 규칙 기반 자동화 계층 결합
  • 승인된 증명을 Lean 파일로 변환 및 출력 가능
  • 전용 학습 데이터 없이도 miniF2F 벤치마크에서 효과적 성능 입증

우리는 LLM(Large Language Models)과 인간이 수학을 작성하는 방식에 맞춰 설계된 의존 타입 기반(dependent-type-based) 증명기를 제시하며, 이는 Lean 및 Rocq와 같은 기존 시스템을 보완합니다. 이 시스템의 핵심 설계 선택 사항은 수학적 자연어(mathematical natural language)를 모방하는 표면층(surface)과, 교과서에서 생략될 법한 일상적인 단계들을 처리하는 규칙 기반 자동화 계층(rule-driven automation layer)입니다. 이를 통해 승인된 증명은 검증된 Lean 파일로 다시 출력될 수 있습니다. 초기 실험 결과에 따르면, 증명기 전용 학습 데이터가 없는 상태에서도 LLM은 miniF2F 벤치마크에서 이를 효과적으로 사용하는 법을 배울 수 있음을 시사합니다. Lean 출력 발췌본: https://github.com/xiyuzhai-husky-lang/visored/

AI 자동 생성 콘텐츠

본 콘텐츠는 arXiv cs.PL (Programming Languages)의 원문을 AI가 자동으로 요약·번역·분석한 것입니다. 원 저작권은 원저작자에게 있으며, 정확한 내용은 반드시 원문을 확인해 주세요.

원문 바로가기
0

댓글

0