왜 아무도 Microsoft의 오픈 소스 Fast Context에 대해 이야기하지 않나요!!!
요약
Microsoft가 공개한 FastContext-1.0은 LLM 코딩 에이전트의 효율성을 높이기 위한 경량 저장소 탐색 서브 에이전트입니다. 메인 에이전트와 탐색 역할을 분리하여 병렬 도구 호출을 통해 컨텍스트를 압축하고 토큰 사용량을 획기적으로 줄입니다.
핵심 포인트
- 메인 에이전트와 저장소 탐색 역할을 분리하여 효율성 극대화
- SWE-bench Pro 등 주요 벤치마크에서 엔드 투 엔드 정확도 향상
- 최대 60.3%의 토큰 절감 효과 제공
- 소형 모델(4B)로도 대형 모델(30B) 이상의 탐색 성능 구현 가능
https://github.com/microsoft/fastcontext
FastContext-1.0은 LLM 코딩 에이전트를 위한 경량 저장소 탐색 (repository-exploration) 서브 에이전트 (subagent)입니다. 단일 모델이 저장소를 탐색하고 작업을 해결하는 것을 모두 수행하게 하는 대신, FastContext는 이 두 역할을 분리합니다. 이는 메인 코딩 에이전트에 의해 필요할 때 호출되며, 병렬 읽기 전용 도구 호출 (READ, GLOB, GREP)을 실행하고, 집중된 컨텍스트 (context)로서 압축된 파일 경로와 라인 범위를 반환합니다.
FastContext-1.0은 LLM 코딩 에이전트를 위한 경량 저장소 탐색 (repository-exploration) 서브 에이전트 (subagent)입니다. 단일 모델이 저장소를 탐색하고 작업을 해결하는 것을 모두 수행하게 하는 대신, FastContext는 이 두 역할을 분리합니다. 이는 메인 코딩 에이전트에 의해 필요할 때 호출되며, 병렬 읽기 전용 도구 호출 (READ, GLOB, GREP)을 실행하고, 집중된 컨텍스트 (context)로서 압축된 파일 경로와 라인 범위를 반환합니다.https://github.com/can1357/oh-my-pi/pull/3164
https://github.com/can1357/oh-my-pi/pull/3164
저는 개인적으로 oh my pi에 로컬 Fast Context 지원을 추가하고 있으며, https://cognition.com/blog/swe-1-6 는 Fast Context와 유사하거나 혹은 더 나은 수준인데, 제 oh my pi PR에서 지원됩니다.
주요 특징:
FastContext는 모든 메인 에이전트와 벤치마크 (benchmark)에서 엔드 투 엔드 (end-to-end) 정확도를 향상시킵니다; 가장 큰 이득은 SWE-bench Pro에서 나타납니다 (예: GPT-5.4 +5.5, GLM-5.1 +5.0).
가장 큰 토큰 (token) 절감률은 60.3%에 달합니다 (SWE-QA 상의 GPT-5.4).
압축된 4B-RL 탐색기 (explorer)는 더 큰 30B-SFT 탐색기보다 더 나은 성능을 낼 수 있습니다 — 예: GLM-5.1 SWE-bench Pro에서 더 적은 토큰을 사용하면서도 22.5 대 20.0의 성능을 달성합니다.
/u/formatme 에 의해 r/LocalLLaMA 에 제출됨
[link] [comments]
AI 자동 생성 콘텐츠
본 콘텐츠는 r/OpenAI Codex (search)의 원문을 AI가 자동으로 요약·번역·분석한 것입니다. 원 저작권은 원저작자에게 있으며, 정확한 내용은 반드시 원문을 확인해 주세요.
원문 바로가기