본문으로 건너뛰기

© 2026 Molayo

GitHub요약2026. 06. 15. 03:54

vybestack/llxprt-code

요약

LLxprt Code는 모든 LLM 제공업체와 호환되는 CLI 기반 AI 코딩 어시스턴트입니다. 특정 서비스에 종속되지 않고 Anthropic, OpenAI, Gemini 등 다양한 모델을 사용하거나 로컬 모델을 통해 개인정보를 보호하며 코딩할 수 있습니다.

핵심 포인트

  • 모든 LLM 제공업체 및 로컬 모델(LM Studio 등) 지원
  • 다중 계정 페일오버 및 로드 밸런싱 기능 제공
  • 터미널 네이티브 CLI 및 Zed 에디터 통합 지원
  • 개인정보 보호를 위한 로컬 실행 및 텔레메트리 미사용

모든 LLM 제공업체와 함께 작동하는 AI 기반 코딩 어시스턴트. 코드베이스를 쿼리 및 편집하고, 애플리케이션을 생성하며, 개발 워크플로우를 자동화하기 위한 명령줄 인터페이스 (CLI)입니다.

강력한 LLM 옵션으로 즉시 시작하세요:

# 무료 Gemini 모델
/auth gemini enable
/provider gemini
...

기존 구독 활용: Claude Pro/Max, ChatGPT Plus/Pro (Codex)를 OAuth를 통해 직접 사용하세요. Kimi/Synthetic/Chutes 구독은 키 (keys)를 통해 사용 가능합니다.
다중 계정 페일오버 (Multi-Account Failover): 속도 제한 (rate limits) 발생 시 자동으로 전환되는 여러 OAuth 계정을 구성하세요.
로드 밸런서 프로필 (Load Balancer Profiles): 자동 페일오버와 함께 제공업체 또는 계정 간에 요청을 분산하세요.
무료 티어 지원: Gemini 또는 Qwen 무료 티어로 즉시 코딩을 시작하세요.
제공업체 유연성: Anthropic, Gemini, OpenAI, Kimi 또는 OpenAI 호환 제공업체 간에 자유롭게 전환하세요.
최상급 오픈 모델: GLM 5, Kimi K2.5, MiniMax M2.5, Qwen 3 Coder Next와 원활하게 작동합니다.
로컬 모델: 완전한 개인정보 보호를 위해 LM Studio, llama.cpp를 사용하여 모델을 로컬에서 실행하세요.
개인정보 보호 우선: 기본적으로 텔레메트리 (telemetry)가 없으며 로컬 처리가 가능합니다.
서브에이전트 (Subagent) 유연성: 서로 다른 모델, 제공업체 또는 설정을 가진 에이전트를 생성하세요.
대화형 REPL (Interactive REPL): 다양한 테마를 갖춘 아름다운 터미널 UI를 제공합니다.
Zed 통합: 원활한 워크플로우를 위한 네이티브 Zed 에디터 통합을 지원합니다.

# macOS (Homebrew)
brew tap vybestack/homebrew-tap
brew update
...

LLxprt Code는 터미널을 떠나지 않고도 강력한 LLM 기능을 원하는 개발자를 위해 설계된 명령줄 AI 어시스턴트입니다. GitHub Copilot이나 ChatGPT와 달리, LLxprt Code는 모든 제공업체와 함께 작동하며 완전한 개인정보 보호를 위해 로컬에서 실행될 수 있습니다.

주요 차이점:

오픈 소스 및 커뮤니티 주도: 독점적인 생태계에 종속되지 않습니다.
제공업체 불가지론 (Provider agnostic): 하나의 AI 서비스에 갇히지 않습니다.
로컬 우선 (Local-first): 필요 시 완전히 오프라인으로 실행할 수 있습니다.
개발자 중심: 코딩 워크플로우를 위해 특별히 구축되었습니다.
터미널 네이티브: 웹 인터페이스가 아닌 CLI 워크플로우를 위해 설계되었습니다.

사전 요구 사항 (Prerequisites): Node.js 20+ 설치됨 (Homebrew 사용 시 불필요) -
설치 (Install):

macOS (Homebrew)

brew tap vybestack/homebrew-tap
brew update
brew install llxprt-code

npm

npm install -g @vybestack/llxprt-code

또는 설치 없이 실행:

npx @vybestack/llxprt-code

실행 (Run):
llxprt

프로바이더(Provider) 선택:
/provider를 사용하여 선호하는 LLM 서비스를 선택하세요 -
코딩 시작:
질문하기, 코드 생성 또는 프로젝트 분석

첫 세션 예시:

cd your-project/
llxprt
> Explain the architecture of this codebase and suggest improvements
...

구독 OAuth (Subscription OAuth)

  • Claude Pro/Max, ChatGPT Plus/Pro (Codex) 또는 Kimi 구독을 직접 사용
    무료 티어 (Free Tiers)
  • 넉넉한 제한을 제공하는 Gemini, Qwen 무료 티어
    멀티 계정 페일오버 (Multi-Account Failover)
  • 속도 제한 (Rate limits) 발생 시 자동으로 전환되는 여러 개의 OAuth 버킷 구성
    로드 밸런서 프로필 (Load Balancer Profiles)
  • 라운드 로빈 (Round-robin) 또는 페일오버 (Failover) 정책을 통해 프로바이더/계정 간 부하 분산
    광범위한 프로바이더 지원 (Extensive Provider Support)
  • Anthropic, Gemini, OpenAI, Kimi 및 모든 OpenAI 호환 프로바이더
    프로바이더 가이드 (Provider Guide) →
    최고의 오픈 모델 (Top Open Models)
  • GLM 5, Kimi K2.5, MiniMax M2.5, Qwen 3 Coder Next
    로컬 모델 지원 (Local Model Support)
  • 완전한 프라이버시를 위한 LM Studio, llama.cpp, Ollama 지원
    프로필 시스템 (Profile System)
  • 프로바이더 구성 및 모델 설정 저장
    고급 서브에이전트 (Advanced Subagents)
  • 서로 다른 모델/프로바이더를 사용하는 격리된 AI 어시스턴트
    MCP 통합 (MCP Integration)
  • 외부 도구 및 서비스와 연결
    아름다운 터미널 UI (Beautiful Terminal UI)
  • 구문 강조 (Syntax highlighting)가 포함된 다양한 테마

대화형 모드 (Interactive Mode, REPL):
탐색, 신속한 프로토타이핑 및 반복적인 개발에 최적화되어 있습니다:

# 대화형 세션 시작
llxprt
> Explore this codebase and suggest improvements
...

비대화형 모드 (Non-Interactive Mode):
자동화, CI/CD 및 스크립트 워크플로우에 이상적입니다:

# 즉각적인 응답을 제공하는 단일 명령
llxprt --profile-load zai-glm5 "Refactor this function for better readability"
llxprt "Generate unit tests for payment module" > tests/payment.test.js

LLxprt Code는 다음과 같은 최고의 오픈 웨이트 (open-weight) 모델들과 원활하게 작동합니다:

컨텍스트 윈도우 (Context Window): 262,144 토큰
아키텍처 (Architecture): Trillion-parameter MoE (32B active)
강점 (Strengths): 심층 추론 (Deep reasoning), 다단계 도구 오케스트레이션 (multi-step tool orchestration), 200-300회의 연속적인 도구 호출 (sequential tool calls)
특징 (Special): 도구 인터리빙 (tool interleaving)을 포함한 네이티브 사고/추론 (thinking/reasoning) 모드

/provider kimi
/model kimi-for-coding
# 또는 Synthetic/Chutes를 통해:
...

컨텍스트 윈도우 (Context Window): 200,000 토큰
최대 출력 (Max Output): 131,072 토큰
아키텍처 (Architecture): 총 355B 파라미터의 전문가 혼합 (Mixture-of-Experts, 32B active)
강점 (Strengths): 코딩 (Coding), 다단계 계획 (multi-step planning), 도구 통합 (tool integration)

컨텍스트 윈도우 (Context Window): 1M 토큰
아키텍처 (Architecture): 총 230B 파라미터의 MoE (10B active)
강점 (Strengths): 코딩 워크플로우 (Coding workflows), 다단계 에이전트 (multi-step agents), 도구 호출 (tool calling)
비용 (Cost): Claude Sonnet의 8% 수준, 약 2배 더 빠름

컨텍스트 윈도우 (Context Window): 262,144 토큰
최대 출력 (Max Output): 65,536 토큰
아키텍처 (Architecture): 총 480B 파라미터의 MoE (35B active)
강점 (Strengths): 에이전트 기반 코딩 (Agentic coding), 브라우저 자동화 (browser automation), 도구 사용 (tool usage)
성능 (Performance): SWE-bench Verified에서 최첨단 (State-of-the-art) 성능 기록 (69.6%)

최대 수준의 개인정보 보호를 위해 모델을 완전히 오프라인으로 실행하세요:

# LM Studio 사용 시
/provider openai
/baseurl http://localhost:1234/v1/
...

지원되는 로컬 프로바이더 (local providers):

LM Studio: 쉬운 Windows/Mac/Linux 설정
llama.cpp: 최대 성능 및 제어
Ollama: 간편한 모델 관리
모든 OpenAI 호환 API (Any OpenAI-compatible API): 완전한 유연성

격리된 컨텍스트와 서로 다른 설정을 가진 특화된 AI 어시스턴트를 생성하세요:

# 서브에이전트 (Subagents)는 사용자 정의 프로필 및 도구 액세스 권한과 함께 실행됩니다
# 명령 인터페이스를 통해 액세스
/subagent list
...

각 서브에이전트는 다음과 같이 구성될 수 있습니다:

서로 다른 프로바이더 (Different providers) (Gemini vs Anthropic vs Qwen vs Local)
서로 다른 모델 (Different models) (Flash vs Sonnet vs GLM 5 vs Custom)
서로 다른 도구 액세스 (Different tool access) (특정 도구 제한 또는 허용)
서로 다른 설정 (Different settings) (Temperature, 타임아웃, 최대 턴 수)
격리된 런타임 컨텍스트 (Isolated runtime context) (메모리 또는 상태 교차 없음)

서브에이전트는 다음과 같은 용도로 설계되었습니다:

특화된 작업 (Specialized tasks) (코드 리뷰 (Code review), 디버깅 (debugging), 문서화 (documentation))
서로 다른 전문 분야 (Different expertise areas) (프론트엔드 (Frontend) vs 백엔드 (Backend) vs 데브옵스 (DevOps))
도구 제한 환경 (Tool-limited environments) (읽기 전용 분석 (Read-only analysis) vs 전체 개발 (Full development))
실험적 구성 (Experimental configurations) (새로운 모델 또는 설정 테스트)

LLxprt Code는 에이전트 통신 프로토콜 (Agent Communication Protocol (ACP))을 사용하여 Zed 에디터와 통합됩니다:

{
"agent_servers": {
"llxprt": {
...

Zed의 settings.jsonagent_servers 아래에서 설정하세요. 바이너리 경로를 찾으려면 which llxprt를 사용하세요.

기능:

에디터 내 채팅 (In-editor chat): Zed를 떠나지 않고 직접적인 AI 상호작용
코드 선택 (Code selection): 특정 코드 선택 영역에 대해 질문
프로젝트 인식 (Project awareness): 열려 있는 워크스페이스의 전체 컨텍스트 활용
다중 제공자 (Multiple providers): Claude, OpenAI, Gemini 등을 위한 서로 다른 에이전트 구성

전체 제공자 가이드 (Complete Provider Guide) →

설정 및 프로필 (Settings & Profiles): 모델 파라미터 미세 조정 및 구성 저장
서브에이전트 (Subagents): 다양한 작업을 위한 특화된 어시스턴트 생성
MCP 서버 (MCP Servers): 외부 도구 및 데이터 소스 연결
체크포인팅 (Checkpointing): 복잡한 대화 저장 및 재개
IDE 통합 (IDE Integration): VS Code 및 기타 에디터와 연결

전체 문서 (Full Documentation) →

Gemini CLI로부터: 마이그레이션 가이드 (Migration Guide)
로컬 모델 설정 (Local Models Setup): 로컬 모델 가이드 (Local Models Guide)
명령어 참조 (Command Reference): CLI 명령어 (CLI Commands)
문제 해결 (Troubleshooting): 일반적인 문제 (Common Issues)

LLxprt Code는 기본적으로 텔레메트리 (telemetry)를 수집하지 않습니다. 외부 AI 제공자에게 전송하기로 선택하지 않는 한, 귀하의 데이터는 귀하에게 머뭅니다.

외부 서비스를 사용할 때는 해당 서비스의 이용 약관이 적용됩니다:

AI 자동 생성 콘텐츠

본 콘텐츠는 GitHub AI Coding Assistants의 원문을 AI가 자동으로 요약·번역·분석한 것입니다. 원 저작권은 원저작자에게 있으며, 정확한 내용은 반드시 원문을 확인해 주세요.

원문 바로가기
0

댓글

0