CLARITY: 대화형 NL2SQL 시스템에서의 언어 모호성과 답변 불가능성을 위한 프레임워크 및 벤치마크

산업 현장에서 배포된 NL2SQL 시스템은 특히 불완전한 사용자 설명이 있는 대화형 시나리오에서 모호하거나 답변할 수 없는 쿼리를 자주 마주칩니다. 기존 벤치마크들은 일반적으로 단일 출처의 모호성을 가정하고 해결을 위해 사용자 상호작용에 의존하며, 현실적인 실패 모드를 간과합니다. 우리는 Clarity를 소개합니다. 이는 단일 턴 및 다중 턴 설정 모두에서 다양한 모호성과 사용자의 다양한 행동을 가진 NL2SQL 벤치마크를 자동으로 생성하기 위한 프레임워크입니다. 제약 조건 기반 파이프라인을 사용하여 Clarity는 실행 가능한 SQL을 모호한 쿼리로 변환하며, 이를 도식 수준의 메타데이터와 함께 지면화된 대화적 연속성으로 보강합니다. Spider 및 BIRD에 대한 경험적 평가에서 강력한 LLM 기반을 포함한 선두 NL2SQL 시스템은 다면적 모호성 하에서 심각한 성능 저하를 겪는 것으로 나타났습니다. 이러한 시스템들은 종종 모호성을 감지하지만, 근본적인 도식 수준의 원인을 정확하게 파악하고 해결하는 데 어려움을 겪습니다. 우리의 결과는 산업용 NL2SQL 시스템에서 더 강력한 모호성 감지 및 해결이 필요함을 강조합니다.

Insights

CLARITY: 대화형 NL2SQL 시스템에서의 언어 모호성과 답변 불가능성을 위한 프레임워크 및 벤치마크

요약

핵심 포인트

댓글

CoreWeave 대 Nebius 주식: Nvidia가 둘 다 지원하지만, 당신이 사야 할 것은 이것입니다

Extreme Networks (EXTR), 5분기 연속 두 자릿수 매출 성장 달성

Generac Holdings (GNRC), 상업 및 산업 부문의 강력한 매출로 상승

Blackstone, Brookfield, KKR, 160억 달러 규모의 쿠웨이트 석유 인프라 거래 체결

CoreWeave 대 Nebius 주식: Nvidia가 둘 다 지원하지만, 당신이 사야 할 것은 이것입니다

Extreme Networks (EXTR), 5분기 연속 두 자릿수 매출 성장 달성

Generac Holdings (GNRC), 상업 및 산업 부문의 강력한 매출로 상승

Blackstone, Brookfield, KKR, 160억 달러 규모의 쿠웨이트 석유 인프라 거래 체결