FINER-SQL: 텍스트-SQL 생성을 위한 소규모 언어 모델 성능 향상

대규모 언어 모델 (LLM) 은 텍스트-SQL 생성 분야에서 중요한 발전을 주도했습니다. 그러나 이러한 모델은 높은 계산 비용, 긴 지연 시간 (latency), 그리고 데이터 프라이버시 우려로 인해 많은 실제 응용 프로그램에서 실용적이지 못합니다. 자연스러운 대안으로 소규모 언어 모델 (SLM) 을 사용하는 것이 있으며, 이는 효율적이고 사적인 온프레미스 배포를 가능하게 합니다. 그러나 SLM 은 종종 약한 추론 능력과 낮은 지시어 수행 능력을 겪습니다. 희소 이진 보상 (0/1) 을 기반으로 한 기존의 강화 학습 방법은 생성된 SQL 이 잘못되었을 때 거의 학습 신호를 제공하지 못해 불안정하거나 붕괴된 훈련을 유발합니다. 이러한 문제를 극복하기 위해, 우리는 SLM 을 미세한 실행 피드백을 통해 향상시키는 확장 가능하고 재사용 가능한 강화 학습 프레임워크인 FINER-SQL 을 제안했습니다. FINER-SQL 은 그룹 상대 정책 최적화 (Group Relative Policy Optimization) 를 기반으로 하며, 희소 감시를 밀도 높고 해석 가능한 보상으로 대체하여 잘못된 SQL 도 지속적인 피드백을 제공합니다. 이는 두 가지 핵심 보상 함수를 도입합니다: 1) 메모리 보상 (memory reward): 추론과 검증된 추적 (verified traces) 을 정렬하여 의미적 안정성을 달성하고, 2) 원자 보상 (atomic reward): 연산 수준의 중첩을 측정하여 구조적으로 올바르지만 불완전한 SQL 에 대해 부분적인 점수를 부여합니다. 이 접근법은 이산적 정확도를 연속적인 학습으로 변환하여 안정적인 크리티크 프리 최적화를 가능하게 합니다. BIRD 와 Spider 벤치마크에서의 실험 결과, FINER-SQL 은 3B 모델로 최대 67.73% 및 85%의 실행 정확도를 달성하며, 추론 지연 시간을 5.57~s/sample 로 줄였습니다. 이는 훨씬 더 큰 LLM 과 비교하여 비용 효율적이고 프라이버시 보호를 유지하는 고성능 텍스트-SQL 생성 경로를 보여줍니다. 우리의 코드는 https://github.com/thanhdath/finer-sql 에서 이용 가능합니다.

Insights

FINER-SQL: 텍스트-SQL 생성을 위한 소규모 언어 모델 성능 향상

요약

핵심 포인트

댓글

AI 에이전트의 다음 단계인 「Graph Engineering」이란? ~Claude Code가 바꾸는 AI 시스템 설계~

AI 에이전트를 위한 기계 결제 가능 API를 구축하고 낯선 이들로부터 0달러를 벌었습니다. 모든 수치를 공개합니다.

IBM의 Krishna CEO, AI가 자사 소프트웨어 부문을 위협하지 않을 것이라며 투자자 안심시키려 노력

AMD EPYC Zen 7 "Florence", ACE 및 차세대 메모리 탑재 확인

AI 에이전트의 다음 단계인 「Graph Engineering」이란? ~Claude Code가 바꾸는 AI 시스템 설계~

AI 에이전트를 위한 기계 결제 가능 API를 구축하고 낯선 이들로부터 0달러를 벌었습니다. 모든 수치를 공개합니다.

IBM의 Krishna CEO, AI가 자사 소프트웨어 부문을 위협하지 않을 것이라며 투자자 안심시키려 노력

AMD EPYC Zen 7 "Florence", ACE 및 차세대 메모리 탑재 확인