
Netflix 엔지니어가 AI 토큰 사용량을 60-95% 절감하는 오픈 소스 프록시를 개발했습니다
요약
Netflix 엔지니어가 개발한 오픈 소스 프록시가 AI 토큰 사용량을 60-95% 절감합니다. 코드 변경 없이 LLM 클라이언트와 앱 사이에서 작동하며, 정확도 저하 없이 데이터를 압축하여 비용을 획기적으로 줄여줍니다.
핵심 포인트
- 코드 변경 없이 pip install과 환경 변수 설정만으로 사용 가능
- 정확도 저하 없이 토큰 사용량을 60-95% 절감
- OpenAI 호환 클라이언트 및 Claude Code, Cursor 등과 연동 가능
- 요약 방식이 아닌 인플라이트 압축 방식을 사용하여 데이터 손실 방지
🚨 Netflix 엔지니어가 AI 토큰 (token) 사용량을 60-95% 절감하는 오픈 소스 (open-source) 프록시 (proxy)를 구축했습니다.
코드 변경은 전혀 필요 없습니다.
벤치마크 (Benchmarks) 결과, 정확도 (accuracy) 저하는 ±0.000 수준입니다.
✨ GitHub에서 29.9k 개의 스타 (stars)를 기록 중입니다.
이 도구는 앱과 LLM (대규모 언어 모델) 사이에서 작동하며, 모든 도구 출력, 코드 블록, 그리고 대화 기록이 전송 과정에서 압축 (compressed in-flight)됩니다.
🚫 요약 (summarization)은 없으며, 손실도 없습니다.
😎 동일한 답변을 유지하면서 토큰 (tokens) 사용량만 60-95% 줄여줍니다.
Claude Code, Cursor, Copilot, 그리고 모든 OpenAI 호환 클라이언트 (OpenAI-compatible client)와 함께 작동합니다.
단 한 번의 pip install과 하나의 환경 변수 (env var) 설정으로 완료됩니다.
Netflix는 이를 내부적으로 사용하고 있습니다.
Apache 2.0 라이선스입니다.
Tejas Chopra가 제작했습니다.
[IMG:1]
AI 자동 생성 콘텐츠
본 콘텐츠는 X AI 사용법/팁의 원문을 AI가 자동으로 요약·번역·분석한 것입니다. 원 저작권은 원저작자에게 있으며, 정확한 내용은 반드시 원문을 확인해 주세요.
원문 바로가기