UFAL-CUNI SemEval-2026 과제 11 제출: 시론적 추론을 위한 효율적인 모듈형 신경 기호 방법
요약
본 기술 기사는 SemEval-2026 과제 11(대규모 언어 모델에서 내용과 형식 추론 분리)에 제출된 시스템을 소개합니다. 이 시스템은 소수 파라미터의 작은 LLM과 기호 증명기를 결합한 효율적인 모듈형 신경 기호 접근법을 사용합니다. 주요 구성 요소로는 자연어 시론을 일차 논리(FOL)로 변환하는 LLM 기반 파서, 자동 정리 증명기, 그리고 다국어 처리를 위한 기호 검색 컴포넌트가 포함됩니다.
핵심 포인트
- SemEval-2026 과제 11을 위해 내용과 형식 추론 분리라는 목표를 설정했습니다.
- 효율성을 위해 소수 파라미터(4B)의 작은 LLM과 기호 증명기를 결합한 모듈형 신경 기호 접근법을 채택했습니다.
- 시스템은 자연어-FOL 변환, 자동 정리 증명, 다국어 전제 식별 등 두 가지 선택적 모듈로 구성되어 유연성을 높였습니다.
- 본 접근법은 LLM 기반 제로샷 베이스라인보다 우수한 성능을 보였으나, 소수 LLM의 다국어 능력 한계도 분석했습니다.
이 논문은 SemEval-2026 과제 11 (대규모 언어 모델에서 내용과 형식 추론의 분리) 에 제출된 시스템을 설명합니다. 우리는 소수 개의 파라미터 (4B) 를 가진 작은 추론 LLM 과 기호 증명기를 결합한 효율적인 모듈형 신경 기호 접근법을 제시합니다. 시스템은 자연어 시론을 일차 논리 (FOL) 표현으로 변환하는 LLM 기반 파서, 자동 정리 증명기, 그리고 다국어 입력을 위한 기계 번역 및 관련 전제 식별을 위한 기호 검색 컴포넌트 등 두 가지 선택 모듈로 구성됩니다. 시스템은 대부분의 하위 과제에서 경쟁력 있는 정확도와 상대적으로 낮은 내용 효과를 달성했습니다. 우리의 아벨레이션 (ablation) 분석은 이 접근법이 해당 파라미터 크기 범위에서 LLM 기반 제로샷 베이스라인을 능가하지만, 소수 LLM 의 다국어 능력의 한계를 드러냅니다. 마지막으로, 과제의 주요 순위 지표에 대한 논의와 그 한계 분석을 포함했습니다.
AI 자동 생성 콘텐츠
본 콘텐츠는 arXiv cs.CL의 원문을 AI가 자동으로 요약·번역·분석한 것입니다. 원 저작권은 원저작자에게 있으며, 정확한 내용은 반드시 원문을 확인해 주세요.
원문 바로가기