arXiv논문2026. 05. 12. 19:12

오류 경계 언어 생성(Mistake-Bounded Language Generation)

요약

본 기사는 언어 생성 모델의 성능 평가 지표를 개선하기 위해 기존의 '마지막 오류 시점' 대신 '오류 경계 생성(mistake-bounded generation)'이라는 새로운 개념을 제안합니다. 이 접근 방식은 단순히 최종 결과의 일관성보다는, 생성 과정 전반에 걸쳐 발생하는 누적되는 유효하지 않은 요소(invalid elements)의 총 개수를 최소화하는 데 초점을 맞춥니다. 이를 통해 모델 학습 목표를 재정립하고, '정확한 시연으로부터 학습' 프레임워크와 연결하여 이론적인 기반을 마련합니다.

핵심 포인트

전통적인 언어 생성 평가 지표인 '마지막 오류 시점(time-of-last-mistake)'의 한계를 극복하고자 합니다.
새로운 목표는 생성 과정 중 발생하는 유효하지 않은 요소(invalid elements)의 총 개수를 최소화하는 것입니다.
이 접근 방식은 최종 결과의 일관성뿐만 아니라, 학습 과정에서의 누적 오류를 중요하게 다룹니다.
'정확한 시연으로부터 학습' 프레임워크와 연결하여 이론적인 축소(formal reduction)를 확립합니다.

우리는 극한에서의 언어 생성 학습 과제를 조사하지만, 생성기의 성공을 측정하는 전통적인 '마지막 오류 시점(time-of-last-mistake)' 지표에서 벗어나 새로운 개념인 '오류 경계 생성(mistake-bounded generation)'에 초점을 맞춥니다. 기존의 극한에서의 언어 생성 결과들은 궁극적인 일관성(eventual consistency)을 보장하는 데 중점을 두지만, 학습 과정 중에 발생하는 누적 오류는 간과합니다. 우리는 이 문제를 해결하기 위해 목표를 생성 알고리즘이 출력하는 유효하지 않은 요소(invalid elements)의 총 개수를 최소화하는 것으로 전환합니다. 이를 통해 Joshi 등(2025)의 '정확한 시연으로부터 학습(Learning from Correct Demonstrations)' 프레임워크로 공식적인 축소(formal reduction)를 확립하며, g

AI 자동 생성 콘텐츠

원문 바로가기

오류 경계 언어 생성(Mistake-Bounded Language Generation)

요약

핵심 포인트

댓글