대규모 데이터베이스에는 작고 오픈 웨이트(Open-Weight)인 언어 모델이 필요하다

독점 API (Proprietary APIs)를 중심으로 구축된 언어 모델 시스템은 종종 토큰 기반 비용 모델 (Token-based cost model)로 운영됩니다. 이는 LM(Language Model) 강화 관계 연산자 (Relational operators)가 단 한 번의 실험 세트만으로도 10,000달러를 초과하는 비용을 발생시킬 수 있는 대규모 데이터베이스 맥락에서는 감당하기 어려울 정도로 비싸지며, 이는 철저한 연구와 실질적인 배포를 저해합니다. 본 논문에서 우리는 단 16GB의 VRAM에서 로컬로 실행되는 양자화된(Quantized) 오픈 웨이트(Open-weight) 모델이 더 낮은 지연 시간(Latency)과 훨씬 저렴한 비용으로 폐쇄형 소스(Closed-source) 모델의 정확도와 대등하거나 이를 능가할 수 있음을 입증하며, 효과적인 LM-데이터베이스 통합을 위해 폐쇄형 소스 LM API가 필수적이라는 기존의 가설에 도전합니다. 우리는 이러한 오픈 웨이트 모델을 LM-DB 시스템 내에 효율적으로 배포하는 데 필요한 핵심 시스템 최적화 방안을 제시하고 분석합니다. 이러한 로컬 모델을 BlendSQL v0.1.0 프레임워크에 통합함으로써, 우리는 독점 LM API와 비교했을 때 전체 비용을 390배 절감하고 지연 시간을 3.8배 단축함을 입증했습니다. 우리의 코드는 https://github.com/CapitalOne-Research/play-by-the-type-rules/tree/main/sembench 에서 확인할 수 있습니다.

Insights

대규모 데이터베이스에는 작고 오픈 웨이트(Open-Weight)인 언어 모델이 필요하다

요약

핵심 포인트

댓글

AI 에이전트가 코드베이스에 매몰되지 않도록 방지하는 "Context OS"를 구축했습니다

AI 파일럿이 프로덕션 단계로 넘어가기 전에 중단되는 이유

Anthropic의 오랫동안 중단되었던 Fable 5 서비스 재개 승인

LLM을 대규모로 배포할 때 아무도 말해주지 않는 것들

AI 파일럿이 프로덕션 단계로 넘어가기 전에 중단되는 이유

Anthropic의 오랫동안 중단되었던 Fable 5 서비스 재개 승인

LLM을 대규모로 배포할 때 아무도 말해주지 않는 것들