DeepSeek Reasonix - 높은 캐싱과 낮은 비용의 DeepSeek 네이티브 코딩 에이전트 - Insights | Molayo

DeepSeek 캐시를 활용하는 데 꼭 DeepSeek 전용 코딩 에이전트가 필요한지는 잘 모르겠음
어제 Codex 할당량 문제가 아직 해결되지 않아서, DeepSeek V4 Pro를 Codex에서 쓰려고 아주 작은 브리지를 만들었는데, 내가 한 작업의 거의 대부분이 캐시된 것처럼 보였음: https://i.imgur.com/7eKn6wN.png
2026-05-23 기준 입력 캐시 적중 39,123,200 토큰, 캐시 미적중 1,692,286 토큰이었고, 브리지는 특별한 일을 하지 않고 DeepSeek API 형태를 Codex가 기대하는 형태로 맞춰줄 뿐이라 캐싱 관련 특수 처리는 전혀 없음
캐싱이 더 좋아진다는 점 외에는, DeepSeek API로 OpenCode를 직접 띄우는 것과 비교해 어떤 이점이 있는지 잘 모르겠음. 그것도 분명 비슷하게 캐싱이 되고, 중요하다면 api.deepseek.com과 직접 통신하며, 훨씬 성숙한 실행 환경을 얻게 됨

이 페이지를 링크하는 편이 더 나아 보임: https://github.com/esengine/DeepSeek-Reasonix/blob/main/docs...
왜 더 나은 해법이라고 보는지, 왜 그렇게 강한 설계 철학을 갖는지 설명하고 있음
“자동 접두사 캐싱은 이전 요청의 정확한 바이트 접두사가 일치할 때만 활성화된다. 대부분의 에이전트 루프는 매 턴 순서를 바꾸거나 다시 쓰거나 새 타임스탬프를 주입한다 — 실제 캐시 적중률은 20% 미만”
그래서 이 부분과 다른 기법들을 최적화해 캐시 적중률을 높이고 비용을 낮추는 구조임

“DeepSeek V4 Pro를 Codex에서 쓰려고 작은 브리지를 만들었다”면 그 브리지를 공유해 줄 수 있는지 궁금함
DeepSeek v4는 claude-code나 opencode와 같이 쓰면 훌륭함. 내 경우 claude code가 opencode보다 비용이 덜 들었는데, 아마 더 잘 설계된 실행 환경 때문이라고 봄

이건 터미널에 네이티브로 붙는 것처럼 보임. 즉, TUI 안에서 에이전트를 실행하거나 감싸는 별도 앱이 없는 구조 같음
결국 명령어 대신 일반 영어 문장을 입력하는 방식인가 봄

이 웹사이트는 Codex가 만든 것처럼 보임. 팀을 위해 기능 개요 HTML을 만들어 달라고 Codex에 시켰더니, 과하게 꾸며진 괴물이 나왔는데, 의미 있는 정보는 거의 없는 큰 통계 박스, 같은 글꼴·색상·레이아웃·히어로 섹션까지 딱 비슷했음
이 사이트처럼 모바일에서도 끔찍했음. 결국 Claude에게 한 페이지짜리 HTML 파일을 만들게 했고, 의도를 명확히 설명하는 데 95% 정도는 바로 쓸 수 있었으며 약간만 수정하면 됐음

요즘 LLM 기반 디자인이 많이 이렇게 보임. 강하게 기울어진 세리프 글꼴 조합을 사람들이 왜 못생겼다고 느끼지 않는지 모르겠음
모바일에서는 코드 예제가 계속 콘텐츠를 밀어내서 페이지 대부분을 읽기도 어려움. 물론 너무 가혹한 평일 수 있고 의도는 좋았겠지만, 더 단순한 웹사이트면 충분했을 듯함

“Claude가 한 페이지짜리 HTML 파일을 만들었고 95% 정도는 바로 쓸 수 있었다”는 말만으로는 어떤 모델에 대해서도 많은 걸 말해주지 않음
애초에 소프트웨어 엔지니어라면 누구나 알듯이, 기능을 빼면 어떤 프로젝트든 급격히 단순해질 수 있음

작성자가 이해해 줬으면 하는 건, 어떤 사람들은 컴퓨터 메모리 절반을 먹지 않는 단일 자체 포함 바이너리를 원하고, 그래서 Rust나 Go로 쓰고 싶어 한다는 점임

Rust, Go, Zig로 새 소프트웨어가 많이 나오는 건 정말 반가움
느린 인터프리터 언어가 제공하던 가치와 개발 편의성은 점점 사라지고 있음. 새 언어들은 좋은 것들을 기본으로 갖추고 있거나, 더 정확히는 새벽 1시 호출 알람이 우리를 화나게 만들기 시작한 듯함

AI를 쓴다는 점과 온갖 주장들이 있다고 해도, 예를 들어 순수 Go로 코딩 에이전트를 못 쓸 이유가 뭔지 설명해 줄 수 있는지 궁금함
Go에는 좋은 터미널 라이브러리가 이미 많음

컴퓨터 메모리 절반 이상을 먹는 단일 자체 포함 바이너리를 시험해 보고 싶다면 ds4-agent도 있음

특히 코딩 에이전트 시대에 그런 걸 원한다면, 그냥 직접 만들면 되지 않나 싶음

코딩 봇을 만들면서 정작 코딩을 아끼는 건 뭔가를 말해주는 듯함

그 페이지는 마음에 들지 않음. 타이핑 애니메이션 때문에 예제 영역 크기가 계속 바뀌고, 아래 콘텐츠가 위아래로 밀려남
정말 나쁜 사용자 경험임

에이전트가 있든 없든, 사람들은 여전히 웹사이트를 여러 해상도나 최소한 창 너비별로 테스트해야 함
그런데 이게 점점 잃어버린 기술이 되어가는 것 같음

Claude가 만든 디자인 AI 찌꺼기 같음

1년 동안 실행 환경을 만들어 온 입장에서 보면, opencode 쪽 사람들이 멍청해서 접두사 캐시를 깨는 게 아님
보통 일부러 그렇게 하는 건 테스트해 봤을 때 전체 결과가 더 좋기 때문임
dsv4가 다른 모델들의 평균적인 동작과 충분히 다르다고 생각한다면, 근거와 함께 특정 예외 처리를 추가하는 패치를 원하는 실행 환경에 PR로 보내면 됨. “캐시 때문에 항상 append-only로 가야 한다”고 맹목적으로 가정하는 건 모두의 시간을 낭비하는 일임

이건 DeepSeek가 만든 에이전트가 아니므로 제목이 오해를 부름

이제 DeepSeek의 브랜드가 충분히 강해져서, 사람들이 그 브랜드 인지도에 올라타고 싶어 하는 단계가 됐음

꽤 재미있음. 나는 월 200달러짜리 Claude 구독자이고, 그동안 다른 걸 쓸 필요가 거의 없었음
그런데 Claude가 내 작업 흐름을 점점 제한할수록, 특히 최근 IDE/-p 사용 변경 이후로, 다른 곳으로 가고 싶어짐
최첨단 추론은 정말 원해서 걱정되지만, DeepSeek에는 여전히 관심이 감

최첨단 추론을 원한다면 다른 모델도 한번 써보고 최상위 모델과 얼마나 다른지 직접 확인해 보는 게 좋음
나는 그렇게 해보고 Qwen-2.5-Max만으로도 충분하다는 걸 깨달았음. 내가 다루는 장난감 작업들에는 Claude Sonnet 3.5도 충분할 거라고 봄. 수학 필즈상을 노리는 게 아니니까

오늘 꽤 복잡한 역공학 작업을 DS-4 xhigh와 GPT-5.5 xhigh에 줬음
약 6시간 뒤 둘 다 완전한 역공학에는 실패했지만 차이는 컸음
DS는 30분마다 멈추면서 완전한 역공학을 끝냈고 이제 다 동작할 거라고 말했지만, 실제로는 1%도 끝내지 못했음. 특정 지름길을 쓰지 말라고 강하게 지시했는데도 계속 지름길을 찾았고, 완전한 실패였음
반면 GPT-5.5는 정말 놀라웠음. 해야 할 일을 제대로 했고, 초기 계층을 끝내고 필요한 걸 완전히 이해했다고 확신하기 전에는 다음 단계로 넘어가지 않았음. 6시간 동안 내가 프롬프트를 넣은 건 올바른 방향으로 가는 걸 보고 조금 더 나은 방식으로 살짝 유도했을 때뿐이었음. 싸우고 있다는 느낌이 없었음
물론 압축 이후 가끔 “역공학을 도와줄 수 없다”는 식으로 튀긴 했지만, 새 세션에서는 깔끔하게 해결됐음
Claude 구독은 한 달 전에 취소해서 비교하진 못했지만, DeepSeek는 Opus 4.6/4.7과 작업하던 느낌을 많이 떠올리게 했음. 어떤 사람에게는 긍정 신호일 수도 있겠지만, GPT-5.5를 보니 Claude/DS식 작업 방식은 너무 성가시다는 게 드러남

월 200달러 플랜은 꼭 유지하고, 오픈 가중치 모델과 더 높은 한도가 있는 10달러 코딩 플랜은 시도하지 않는 편이 좋겠음
Anthropic이 살아남으려면 당신 돈이 필요하고, 본인이 최첨단을 쓰고 있다는 생각에 더 잘 잘 수 있을 테니까

Anthropic 모델을 완전히 버리기보다는, 계획 수립 같은 일부 작업에는 쓰고 구현은 DeepSeek 같은 것에 넘기는 선택지도 있음
도구가 달라도 Markdown 계획서는 꽤 잘 통함. 5x Max 구독에서 Pro로 낮추게 되면 나는 그렇게 할 생각임
Claude Code에서 서드파티 제공자를 쉽게 쓰게 해주는 런처도 만들고 있음: https://ccode.kronis.dev
로컬 프록시는 이미 동작하고 있고, 아직 동적 모델 전환만 없음. 추가하기 어렵지는 않을 것 같고, 일정에 따라 1~2주 안에는 들어갈 듯함
Anthropic을 완전히 떠나는 건 현명하지 않다고 봄. 모델이 훌륭하고, 구독하면 내가 좋아하는 Remote Control 같은 기능도 얻을 수 있기 때문임. 다만 티어를 바꿔서 돈을 조금 아끼는 건 가능해 보임. 반대로 품질 기준선은 필요함. 예전에 Cerebras에서 GLM 4.6을 썼을 때는 허술한 결과가 좀 많았음

최첨단 추론을 원한다면 GPT 5.5 Pro를 써야 함

캐시 적중 효율에 집중한 점이 마음에 듦. 사용자 비용 효율을 극대화하는 훌륭한 제품을 만든 DeepSeek 팀에 박수를 보냄

한동안 써봤는데 전적으로 동의함. 내가 같이 쓰는 Codex나 Claude만큼 좋다고 봄
비용에 민감한 구간에서는 승자이고, 어떤 스타트업이 데이터 보존을 염두에 두고 잘 묶어낸다면 기업용으로 팔 수 있는 훌륭한 제품이 될 수 있음. 코딩 어시스턴트 용도에서 핵심 이슈는 데이터 보존과 개인정보 보호이기 때문임

혹시 모르니, 이 프로젝트는 누군가의 사이드 프로젝트임
“독립 오픈소스 프로젝트 · DeepSeek와 무관”

이미 저렴한 API 비용까지 더하면, 아마 같은 작업을 며칠 동안 돌려도 될 것 같음

캐시 적중 효율이라는 게 어떻게 가능한지 모르겠음. 이전 문맥을 바꾸지 않는 문제 아닌가?
여기서 조정할 수 있는 손잡이가 뭐가 있는지 이해가 안 됨

써봤는데 텍스트 입력 영역이 검은 배경에 어두운 글꼴이었음
문서를 확인하고 DeepSeek v4, Claude, Gemini에게 글꼴/스타일 도움을 요청했지만, 어두운 테마 터미널에서 실행하는 것 말고는 아무것도 통하지 않았음. 미친 일임. 이 프로젝트 개발자들은 아무도 밝은 테마를 안 쓰나?

DeepSeek Reasonix - 높은 캐싱과 낮은 비용의 DeepSeek 네이티브 코딩 에이전트

요약

핵심 포인트

댓글