DeepSeek Reasonix - 높은 캐싱과 낮은 비용의 DeepSeek 네이티브 코딩 에이전트
요약
DeepSeek-Reasonix가 캐시 적중률을 높여 비용을 절감하는 방식과 기존 Codex 브리지 구현 사례를 비교 분석합니다. 에이전트 루프의 특성상 발생하는 캐시 미스 문제를 해결하기 위한 설계 철학과 효율적인 실행 환경의 중요성을 다룹니다.
핵심 포인트
- 에이전트 루프의 순서 변경은 캐시 적중률을 20% 미만으로 떨어뜨림
- DeepSeek-Reasonix는 캐시 적중률 최적화를 통해 비용을 낮추는 구조임
- 효율적인 실행 환경 설계가 모델 성능만큼이나 비용 절감에 중요함
- 단일 바이너리 형태의 가볍고 빠른 에이전트 구현(Rust, Go 등)에 대한 요구 존재
DeepSeek 캐시를 활용하는 데 꼭 DeepSeek 전용 코딩 에이전트가 필요한지는 잘 모르겠음
어제 Codex 할당량 문제가 아직 해결되지 않아서, DeepSeek V4 Pro를 Codex에서 쓰려고 아주 작은 브리지를 만들었는데, 내가 한 작업의 거의 대부분이 캐시된 것처럼 보였음: https://i.imgur.com/7eKn6wN.png
2026-05-23 기준 입력 캐시 적중 39,123,200 토큰, 캐시 미적중 1,692,286 토큰이었고, 브리지는 특별한 일을 하지 않고 DeepSeek API 형태를 Codex가 기대하는 형태로 맞춰줄 뿐이라 캐싱 관련 특수 처리는 전혀 없음
캐싱이 더 좋아진다는 점 외에는, DeepSeek API로 OpenCode를 직접 띄우는 것과 비교해 어떤 이점이 있는지 잘 모르겠음. 그것도 분명 비슷하게 캐싱이 되고, 중요하다면 api.deepseek.com과 직접 통신하며, 훨씬 성숙한 실행 환경을 얻게 됨
이 페이지를 링크하는 편이 더 나아 보임: https://github.com/esengine/DeepSeek-Reasonix/blob/main/docs...
왜 더 나은 해법이라고 보는지, 왜 그렇게 강한 설계 철학을 갖는지 설명하고 있음
“자동 접두사 캐싱은 이전 요청의 정확한 바이트 접두사가 일치할 때만 활성화된다. 대부분의 에이전트 루프는 매 턴 순서를 바꾸거나 다시 쓰거나 새 타임스탬프를 주입한다 — 실제 캐시 적중률은 20% 미만”
그래서 이 부분과 다른 기법들을 최적화해 캐시 적중률을 높이고 비용을 낮추는 구조임
“DeepSeek V4 Pro를 Codex에서 쓰려고 작은 브리지를 만들었다”면 그 브리지를 공유해 줄 수 있는지 궁금함
DeepSeek v4는 claude-code나 opencode와 같이 쓰면 훌륭함. 내 경우 claude code가 opencode보다 비용이 덜 들었는데, 아마 더 잘 설계된 실행 환경 때문이라고 봄
이건 터미널에 네이티브로 붙는 것처럼 보임. 즉, TUI 안에서 에이전트를 실행하거나 감싸는 별도 앱이 없는 구조 같음
결국 명령어 대신 일반 영어 문장을 입력하는 방식인가 봄
이 웹사이트는 Codex가 만든 것처럼 보임. 팀을 위해 기능 개요 HTML을 만들어 달라고 Codex에 시켰더니, 과하게 꾸며진 괴물이 나왔는데, 의미 있는 정보는 거의 없는 큰 통계 박스, 같은 글꼴·색상·레이아웃·히어로 섹션까지 딱 비슷했음
이 사이트처럼 모바일에서도 끔찍했음. 결국 Claude에게 한 페이지짜리 HTML 파일을 만들게 했고, 의도를 명확히 설명하는 데 95% 정도는 바로 쓸 수 있었으며 약간만 수정하면 됐음
요즘 LLM 기반 디자인이 많이 이렇게 보임. 강하게 기울어진 세리프 글꼴 조합을 사람들이 왜 못생겼다고 느끼지 않는지 모르겠음
모바일에서는 코드 예제가 계속 콘텐츠를 밀어내서 페이지 대부분을 읽기도 어려움. 물론 너무 가혹한 평일 수 있고 의도는 좋았겠지만, 더 단순한 웹사이트면 충분했을 듯함
“Claude가 한 페이지짜리 HTML 파일을 만들었고 95% 정도는 바로 쓸 수 있었다”는 말만으로는 어떤 모델에 대해서도 많은 걸 말해주지 않음
애초에 소프트웨어 엔지니어라면 누구나 알듯이, 기능을 빼면 어떤 프로젝트든 급격히 단순해질 수 있음
작성자가 이해해 줬으면 하는 건, 어떤 사람들은 컴퓨터 메모리 절반을 먹지 않는 단일 자체 포함 바이너리를 원하고, 그래서 Rust나 Go로 쓰고 싶어 한다는 점임
Rust, Go, Zig로 새 소프트웨어가 많이 나오는 건 정말 반가움
느린 인터프리터 언어가 제공하던 가치와 개발 편의성은 점점 사라지고 있음. 새 언어들은 좋은 것들을 기본으로 갖추고 있거나, 더 정확히는 새벽 1시 호출 알람이 우리를 화나게 만들기 시작한 듯함
AI를 쓴다는 점과 온갖 주장들이 있다고 해도, 예를 들어 순수 Go로 코딩 에이전트를 못 쓸 이유가 뭔지 설명해 줄 수 있는지 궁금함
Go에는 좋은 터미널 라이브러리가 이미 많음
컴퓨터 메모리 절반 이상을 먹는 단일 자체 포함 바이너리를 시험해 보고 싶다면 ds4-agent도 있음
특히 코딩 에이전트 시대에 그런 걸 원한다면, 그냥 직접 만들면 되지 않나 싶음
코딩 봇을 만들면서 정작 코딩을 아끼는 건 뭔가를 말해주는 듯함
그 페이지는 마음에 들지 않음. 타이핑 애니메이션 때문에 예제 영역 크기가 계속 바뀌고, 아래 콘텐츠가 위아래로 밀려남
정말 나쁜 사용자 경험임
에이전트가 있든 없든, 사람들은 여전히 웹사이트를 여러 해상도나 최소한 창 너비별로 테스트해야 함
그런데 이게 점점 잃어버린 기술이 되어가는 것 같음
Claude가 만든 디자인 AI 찌꺼기 같음
1년 동안 실행 환경을 만들어 온 입장에서 보면, opencode 쪽 사람들이 멍청해서 접두사 캐시를 깨는 게 아님
보통 일부러 그렇게 하는 건 테스트해 봤을 때 전체 결과가 더 좋기 때문임
dsv4가 다른 모델들의 평균적인 동작과 충분히 다르다고 생각한다면, 근거와 함께 특정 예외 처리를 추가하는 패치를 원하는 실행 환경에 PR로 보내면 됨. “캐시 때문에 항상 append-only로 가야 한다”고 맹목적으로 가정하는 건 모두의 시간을 낭비하는 일임
이건 DeepSeek가 만든 에이전트가 아니므로 제목이 오해를 부름
이제 DeepSeek의 브랜드가 충분히 강해져서, 사람들이 그 브랜드 인지도에 올라타고 싶어 하는 단계가 됐음
꽤 재미있음. 나는 월 200달러짜리 Claude 구독자이고, 그동안 다른 걸 쓸 필요가 거의 없었음
그런데 Claude가 내 작업 흐름을 점점 제한할수록, 특히 최근 IDE/-p 사용 변경 이후로, 다른 곳으로 가고 싶어짐
최첨단 추론은 정말 원해서 걱정되지만, DeepSeek에는 여전히 관심이 감
최첨단 추론을 원한다면 다른 모델도 한번 써보고 최상위 모델과 얼마나 다른지 직접 확인해 보는 게 좋음
나는 그렇게 해보고 Qwen-2.5-Max만으로도 충분하다는 걸 깨달았음. 내가 다루는 장난감 작업들에는 Claude Sonnet 3.5도 충분할 거라고 봄. 수학 필즈상을 노리는 게 아니니까
오늘 꽤 복잡한 역공학 작업을 DS-4 xhigh와 GPT-5.5 xhigh에 줬음
약 6시간 뒤 둘 다 완전한 역공학에는 실패했지만 차이는 컸음
DS는 30분마다 멈추면서 완전한 역공학을 끝냈고 이제 다 동작할 거라고 말했지만, 실제로는 1%도 끝내지 못했음. 특정 지름길을 쓰지 말라고 강하게 지시했는데도 계속 지름길을 찾았고, 완전한 실패였음
반면 GPT-5.5는 정말 놀라웠음. 해야 할 일을 제대로 했고, 초기 계층을 끝내고 필요한 걸 완전히 이해했다고 확신하기 전에는 다음 단계로 넘어가지 않았음. 6시간 동안 내가 프롬프트를 넣은 건 올바른 방향으로 가는 걸 보고 조금 더 나은 방식으로 살짝 유도했을 때뿐이었음. 싸우고 있다는 느낌이 없었음
물론 압축 이후 가끔 “역공학을 도와줄 수 없다”는 식으로 튀긴 했지만, 새 세션에서는 깔끔하게 해결됐음
Claude 구독은 한 달 전에 취소해서 비교하진 못했지만, DeepSeek는 Opus 4.6/4.7과 작업하던 느낌을 많이 떠올리게 했음. 어떤 사람에게는 긍정 신호일 수도 있겠지만, GPT-5.5를 보니 Claude/DS식 작업 방식은 너무 성가시다는 게 드러남
월 200달러 플랜은 꼭 유지하고, 오픈 가중치 모델과 더 높은 한도가 있는 10달러 코딩 플랜은 시도하지 않는 편이 좋겠음
Anthropic이 살아남으려면 당신 돈이 필요하고, 본인이 최첨단을 쓰고 있다는 생각에 더 잘 잘 수 있을 테니까
Anthropic 모델을 완전히 버리기보다는, 계획 수립 같은 일부 작업에는 쓰고 구현은 DeepSeek 같은 것에 넘기는 선택지도 있음
도구가 달라도 Markdown 계획서는 꽤 잘 통함. 5x Max 구독에서 Pro로 낮추게 되면 나는 그렇게 할 생각임
Claude Code에서 서드파티 제공자를 쉽게 쓰게 해주는 런처도 만들고 있음: https://ccode.kronis.dev
로컬 프록시는 이미 동작하고 있고, 아직 동적 모델 전환만 없음. 추가하기 어렵지는 않을 것 같고, 일정에 따라 1~2주 안에는 들어갈 듯함
Anthropic을 완전히 떠나는 건 현명하지 않다고 봄. 모델이 훌륭하고, 구독하면 내가 좋아하는 Remote Control 같은 기능도 얻을 수 있기 때문임. 다만 티어를 바꿔서 돈을 조금 아끼는 건 가능해 보임. 반대로 품질 기준선은 필요함. 예전에 Cerebras에서 GLM 4.6을 썼을 때는 허술한 결과가 좀 많았음
최첨단 추론을 원한다면 GPT 5.5 Pro를 써야 함
캐시 적중 효율에 집중한 점이 마음에 듦. 사용자 비용 효율을 극대화하는 훌륭한 제품을 만든 DeepSeek 팀에 박수를 보냄
한동안 써봤는데 전적으로 동의함. 내가 같이 쓰는 Codex나 Claude만큼 좋다고 봄
비용에 민감한 구간에서는 승자이고, 어떤 스타트업이 데이터 보존을 염두에 두고 잘 묶어낸다면 기업용으로 팔 수 있는 훌륭한 제품이 될 수 있음. 코딩 어시스턴트 용도에서 핵심 이슈는 데이터 보존과 개인정보 보호이기 때문임
혹시 모르니, 이 프로젝트는 누군가의 사이드 프로젝트임
“독립 오픈소스 프로젝트 · DeepSeek와 무관”
이미 저렴한 API 비용까지 더하면, 아마 같은 작업을 며칠 동안 돌려도 될 것 같음
캐시 적중 효율이라는 게 어떻게 가능한지 모르겠음. 이전 문맥을 바꾸지 않는 문제 아닌가?
여기서 조정할 수 있는 손잡이가 뭐가 있는지 이해가 안 됨
써봤는데 텍스트 입력 영역이 검은 배경에 어두운 글꼴이었음
문서를 확인하고 DeepSeek v4, Claude, Gemini에게 글꼴/스타일 도움을 요청했지만, 어두운 테마 터미널에서 실행하는 것 말고는 아무것도 통하지 않았음. 미친 일임. 이 프로젝트 개발자들은 아무도 밝은 테마를 안 쓰나?
AI 자동 생성 콘텐츠
본 콘텐츠는 GeekNews의 원문을 AI가 자동으로 요약·번역·분석한 것입니다. 원 저작권은 원저작자에게 있으며, 정확한 내용은 반드시 원문을 확인해 주세요.
원문 바로가기