AI Gateway는 1밀리초 미만의 오버헤드로 250개 이상의 LLM에 대한 빠르고 통합된 액세스를 제공하는 오픈 소스
요약
250개 이상의 LLM에 대해 1밀리초 미만의 오버헤드로 통합 액세스를 제공하는 오픈 소스 API 프록시입니다. 자동 재시도, 폴백, 부하 분산 기능을 통해 프로덕션 환경의 신뢰성을 보장합니다.
핵심 포인트
- 1600개 이상의 모델로 라우팅 가능
- 1밀리초 미만의 초저지연 오버헤드 제공
- 자동 재시도 및 부하 분산으로 프로덕션 신뢰성 확보
- npx 명령어나 AWS EC2를 통한 간편한 배포 지원
AI Gateway는 1밀리초 (sub-millisecond) 미만의 오버헤드로 250개 이상의 LLM (Large Language Models)에 대한 빠르고 통합된 액세스를 제공하는 오픈 소스 (open-source) API 프록시입니다.
- 언어, 비전 (vision), 오디오 (audio) 및 이미지 (image) 제공업체 전반에 걸쳐 1600개 이상의 모델 (models)로 라우팅 (Routes)
- 프로덕션 (production) 신뢰성을 위해 자동 재시도 (automatic retries), 폴백 (fallbacks) 및 부하 분산 (load balancing) 처리
- 크기는 122kb이며 프로덕션 (production) 환경에서 매일 10B개 이상의 토큰 (tokens)을 처리
- 단일 npx 명령어로 로컬에 배포하거나 AWS EC2로 배포 가능
여기에서 살펴보세요:
AI 자동 생성 콘텐츠
본 콘텐츠는 X @githubprojects (자동 발견)의 원문을 AI가 자동으로 요약·번역·분석한 것입니다. 원 저작권은 원저작자에게 있으며, 정확한 내용은 반드시 원문을 확인해 주세요.
원문 바로가기