archex: AI 에이전트를 위한 로컬 우선(local-first), 결정론적(deterministic) 코드 컨텍스트 — API 키 불필요 - Insights | Molayo

archex는 저장소(repo)를 코딩 에이전트를 위한 순위가 매겨진 토큰 예산 기반의 컨텍스트 번들로 변환합니다. 모델이 추론하기 전에 필요한 심볼(symbols), 임포트(imports), 의존성 그래프 이웃(dependency-graph neighbors), 그리고 출처(provenance)를 조립합니다. 이 도구는 답변이 아닌 컨텍스트를 반환하며, 실제 사고 과정은 여전히 사용자의 로컬 모델이 수행합니다.

이 서브레딧(sub)에서 관심을 가질 만한 점은 설계 단계부터 로컬 우선(local-first) 방식이라는 것입니다. 호스팅된 추론(hosted inference)이 없으며, 코어에 API 키가 필요하지 않고, 텔레메트리(telemetry)도 없습니다. 전체 검색 파이프라인(BM25F + 로컬 벡터 임베딩(local vector embeddings) + RRF 퓨전(RRF fusion) + 로컬 교차 인코더 재순위화기(local cross-encoder reranker) + 의존성 그래프 확장(dependency-graph expansion))은 사용자의 하드웨어에서 실행되며 완전히 결정론적(deterministic)이므로, 여러 머신과 CI(지속적 통합) 환경에서 결과가 재현 가능합니다.

이것은 오랫동안 진행된 개인 프로젝트로, 최근의 오픈 소스(OSS) 코드 컨텍스트 도구 열풍보다 앞서 시작되었으며, 마침내 공유할 만한 상태에 도달했습니다.

검색 스택은 사용자의 하드웨어에서 실행됩니다: 파싱(parsing)을 위한 tree-sitter (25개 언어), 로컬 임베딩을 위한 ONNX/FastEmbed, 선택 사항인 SPLADE를 사용합니다. BM25 전용 슬림 Docker 이미지는 torch가 전혀 필요하지 않습니다.

측정된, CI 기반 수치 (cocoindex-code와 19개 작업에 대한 헤드 투 헤드 비교, Apple M1 Pro, 동일한 토큰 계산 기준):

재현율(Recall) 0.95 vs 0.32
토큰 효율성(Token efficiency) 0.76 vs 0.48
콜드 스타트(Cold start) 0 ms vs 4,721 ms (데몬 워밍업 없음)
단순 원본 파일 읽기 대비 반환 토큰 약 71% 감소

텔레메트리(Telemetry): 설계상 없음.
submitted by /u/tom_mathews
[link] [comments]

Insights

archex: AI 에이전트를 위한 로컬 우선(local-first), 결정론적(deterministic) 코드 컨텍스트 — API 키 불필요

요약

핵심 포인트

댓글

LLM을 위한 OPD 및 RL 심층 분석

리팩터링을 통해 AI 입력 토큰을 83% 줄인 실험

ACCA 조사 결과, 영국 학생 다수가 대학 진학보다 '학습과 수익 병행' 선호

중국 Alibaba, 미국의 AI 패권에 다시 한번 도전장을 내밀다

LLM을 위한 OPD 및 RL 심층 분석

리팩터링을 통해 AI 입력 토큰을 83% 줄인 실험

ACCA 조사 결과, 영국 학생 다수가 대학 진학보다 '학습과 수익 병행' 선호

중국 Alibaba, 미국의 AI 패권에 다시 한번 도전장을 내밀다