arXiv논문2026. 05. 01. 12:45

반복되는 질문을 위한 신뢰할 수 있는 답변: 템플릿 제약 디코딩을 통한 텍스트-SQL 정확도 향상

요약

본 기사는 대규모 언어 모델(LLMs)을 활용한 텍스트-SQL 생성의 불안정성을 해결하기 위해 '템플릿 제약 디코딩(TeCoD)'이라는 시스템을 소개합니다. TeCoD는 과거의 NL-SQL 쌍에서 재사용 가능한 템플릿을 추출하고, 정교하게 조정된 모듈을 사용하여 적절한 템플릿을 선택합니다. 이후 문법적 제약을 통해 SQL 생성을 강제함으로써, 기존 방식 대비 높은 실행 정확도와 낮은 지연 시간을 달성하여 실제 환경에서의 배포 가능성을 높입니다.

핵심 포인트

LLMs를 이용한 텍스트-SQL 생성은 유용하지만, 복잡하거나 새로운 스키마에서 일관성이 떨어지는 문제가 있습니다.
TeCoD는 과거의 NL-SQL 쌍을 재사용 가능한 '템플릿'으로 변환하여 모델의 안정성을 높입니다.
시스템은 쿼리 패턴을 효율적으로 선택하는 모듈과, SQL 생성 과정에 문법적 제약을 강제하는 디코딩 전략을 결합합니다.
TeCoD는 컨텍스트 학습(ICL) 대비 최대 36% 높은 실행 정확도와 2.2배 낮은 지연 시간을 제공하여 성능 우위를 입증했습니다.

대규모 언어 모델 (LLMs) 은 자연어를 사용하여 구조화된 데이터를 쿼리하는 것을 점점 더 쉽게 만들어 텍스트-SQL 생성에 혁명을 일으켰습니다. 그러나 일관되지 않은 정확도와 유효하지 않은 SQL 을 생성할 위험으로 인해 복잡한 또는 이전에 보지 못한 스키마를 가진 실제 환경에서의 배포는 여전히 어렵습니다. 우리는 레이블이 붙은 워크로드에서 쿼리 패턴의 반복성을 활용하여 이러한 한계를 해결하는 시스템인 템플릿 제약 디코딩 (TeCoD) 을 소개합니다. TeCoD 는 역사적인 NL-SQL 쌍을 재사용 가능한 템플릿으로 변환하고, 정밀한 튜닝된 자연어 추론 모델을 사용하여 쿼리를 효율적으로 일치시키거나 거부하는 강력한 템플릿 선택 모듈을 도입합니다. 템플릿이 선택되면, TeCoD 는 문법 제약 디코딩을 통해 SQL 생성 과정에서 이를 강제합니다. 이는 새로운 분할 전략을 통해 구현되며, 이 전략은 문법적 유효성과 효율성을 모두 보장합니다. 이러한 구성 요소들의 결합은 컨텍스트 학습 (ICL) 대비 최대 36% 높은 실행 정확도와 일치된 쿼리에 대한 2.2 배 낮은 지연 시간을 제공합니다.

AI 자동 생성 콘텐츠

원문 바로가기

반복되는 질문을 위한 신뢰할 수 있는 답변: 템플릿 제약 디코딩을 통한 텍스트-SQL 정확도 향상

요약

핵심 포인트

댓글