UFAL-CUNI SemEval-2026 과제 11 제출: 시론적 추론을 위한 효율적인 모듈형 신경 기호 방법

이 논문은 SemEval-2026 과제 11 (대규모 언어 모델에서 내용과 형식 추론의 분리) 에 제출된 시스템을 설명합니다. 우리는 소수 개의 파라미터 (4B) 를 가진 작은 추론 LLM 과 기호 증명기를 결합한 효율적인 모듈형 신경 기호 접근법을 제시합니다. 시스템은 자연어 시론을 일차 논리 (FOL) 표현으로 변환하는 LLM 기반 파서, 자동 정리 증명기, 그리고 다국어 입력을 위한 기계 번역 및 관련 전제 식별을 위한 기호 검색 컴포넌트 등 두 가지 선택 모듈로 구성됩니다. 시스템은 대부분의 하위 과제에서 경쟁력 있는 정확도와 상대적으로 낮은 내용 효과를 달성했습니다. 우리의 아벨레이션 (ablation) 분석은 이 접근법이 해당 파라미터 크기 범위에서 LLM 기반 제로샷 베이스라인을 능가하지만, 소수 LLM 의 다국어 능력의 한계를 드러냅니다. 마지막으로, 과제의 주요 순위 지표에 대한 논의와 그 한계 분석을 포함했습니다.

Insights

UFAL-CUNI SemEval-2026 과제 11 제출: 시론적 추론을 위한 효율적인 모듈형 신경 기호 방법

요약

핵심 포인트

댓글

AI 오케스트레이터 보안: Langflow IDOR 취약점(CVE-2026-55255) 완화 방법

SpaceX 주식의 가장 큰 리스크는 실적 발표 이후에 찾아옵니다. 주목해야 할 수치들을 확인하세요.

Apple 주식은 고평가되었는가? AlphaSpace 가치 평가 지표가 말하는 바는 무엇인가.

AI 코칭을 활용한 습관 추적기: 나의 데일리 시스템

AI 오케스트레이터 보안: Langflow IDOR 취약점(CVE-2026-55255) 완화 방법

SpaceX 주식의 가장 큰 리스크는 실적 발표 이후에 찾아옵니다. 주목해야 할 수치들을 확인하세요.

Apple 주식은 고평가되었는가? AlphaSpace 가치 평가 지표가 말하는 바는 무엇인가.

AI 코칭을 활용한 습관 추적기: 나의 데일리 시스템