세 가지의 순위 통화와 제로 중첩: 2025 Juejin AI 결산이 실제로 의견을 달리하는 부분
요약
Juejin의 2025년 AI 도구 결산 데이터가 서로 다른 세 가지 기준(가격, 성능 점수, GitHub 스타 속도)으로 분산되어 있어 정보의 일관성이 결여됨을 지적합니다. 각 지표가 서로 모순되는 결과를 초래하여 엔지니어가 도구를 선택할 때 혼란을 줄 수 있다는 점을 강조합니다.
핵심 포인트
- AI 도구 순위가 가격, 성능, 스타 속도라는 세 가지 상이한 기준으로 분절됨
- 지표 간 정규화 부재로 인해 결산 데이터 간의 중첩이 거의 발생하지 않음
- 사용자는 도구 선택 시 서로 다른 데이터 기준을 직접 변환해야 하는 번거로움 발생
오늘 아침 Juejin 2025 AI 도구 결산(roundups)을 Juejin GitHub 트렌딩 월간 리스트와 대조하며 읽다가 깊은 탐구(rabbit hole)에 빠졌습니다. 마침내 제가 명확히 깨달은 사실은, 2025년 말의 결산 형식이 조용히 세 가지의 호환되지 않는 순위 통화(ranking currencies)로 분기되었다는 점입니다. 즉, 12월 코딩 순위에서 출력된 5축 십진수 점수판(five-axis decimal scorecard), 2025 年度盘点(연도별 결산) 기사가 기반으로 삼은 월간 元 가격 열, 그리고 10월, 8월, 5월 GitHub 트렌딩 리스트가 정렬 기준으로 삼은 월간 스타 속도(star-velocity)입니다. 어떤 게시물도 이 중 하나 이상을 사용하지 않으며, 스택을 구성하려는 엔지니어는 추천 사항들이 서로 모순된다는 것을 발견하기 위해 이 세 가지 통화 사이를 직접 변환해야만 합니다. 저는 이 세 가지 통화의 분열이 결산 형식의 기본 상태로 굳어지기 전에 이 문제를 짚고 넘어가고 싶습니다.
저를 한계로 몰아넣은 결정적인 계기는 5월 GitHub 트렌딩 리스트가 2025년 말 선정 결산(picking roundups)과 동시에 발표된 것을 발견했을 때였는데, 두 가지의 독서 경험은 완전히 다른 두 개의 순위를 만들어냈습니다. 5월 리스트는 WeClone, MoneyPrinterTurbo, Void, Suna, LTX-Video, mem0, FlowGram.AI, Ladybird로 시작했습니다. 반면 10월 리스트는 prompt-eng-interactive-tutorial, Agent-S, claude-cookbooks, nanoGPT, supermemory, TradingAgents-CN로 시작했으며, 选型横评(선택 비교 평가) 결과에는 이 중 단 하나의 이름도 등장하지 않았습니다. 공정하게 말하자면, GitHub 리스트는 명시적으로 월간 스타 속도(star velocity)에 따라 정렬하고, 선정 결산은 명시적으로 五轴(5축) 역량 점수에 따라 정렬하며, 저 또한 스타(star) 개수를 액면 그대로 믿지는 않지만, 이러한 구조적 대립이 아침 내내 제 머릿속을 떠나지 않았습니다. 같은 주에 Cursor와 Claude Code를 언급한 选一个开始用(하나를 골라 사용하기) 결과가 나왔음에도, 트렌딩 리스트는 chat-clone 트레이닝 키트와 숏폼 비디오 자동화 프레임워크로 시작했습니다. 이 두 게시물의 상위 10개 항목에는 단 하나의 중첩도 없었습니다.
제가 지적하고 싶은 메타 패턴(meta-pattern)은 2025 Juejin AI 도구 커버리지가 단 하나의 게시물로도 조화될 수 없는 세 가지의 순위 통화(ranking currencies)를 만들어냈으며, 각 게시물은 자신의 결론을 치켜세우는 통화를 선택했다는 점입니다. 2025 年度盘点(연간 결산) 게시물은 월간 元(위안)을 기준으로 삼아 Gemini Pro, ChatGPT Plus, Claude Pro를 모두 월 140 元으로, Midjourney standard를 210 元으로, Claude MAX를 월 700 元으로 명시했는데, 이는 가격 중심의 이야기(price story)입니다. 12월 IDE 순위는 CodeBuddy, Cody, Ghostwriter, Codeium, Tabnine, CodeWhisperer, JetBrains, Blackbox에 대해 9.6/8.2/8.0/7.8/7.6/7.5/7.4/7.2라는 5축 카드(five-axis card)를 기준으로 삼았으며, 이는 성능 중심의 이야기(capability story)입니다. 10월 트렌드 게시물은 prompt-eng-interactive-tutorial과 Agent-S를 앞세웠는데, 이는 개발자 호기심 중심의 이야기(developer-curiosity story)입니다. 솔직히 말해서, 저는 세 가지의 통화 간 정규화(cross-currency normalization) 없이 세 가지 순위 통화가 공존하도록 내버려 두는 그 어떤 2025년 결산 생태계에 대해서도 다소 회의적입니다. 왜냐하면 이 세 가지 통화의 분리는 각 형식이 서로 다른 독자의 과업(reader job)에 최적화되어 있음을 극명하게 보여주기 때문입니다. 즉, 가격 중심의 글은 예산을 고려하는 엔지니어를 위해, 점수판 중심의 글은 구매 담당자를 위해, 트렌드 중심의 글은 동료들이 무엇을 북마크하는지 알고 싶어 하는 개발자를 위해 최적화되어 있으며, 이번 분기에 결제할 도구 하나를 선택하려는 실무 엔지니어의 요구에는 그 어느 것도 깔끔하게 부합하지 않습니다.
제가 남기고 싶은 실질적인 결론은, 이 세 가지 형식은 세 가지의 좁은 목적에는 여전히 유용하지만, 대부분의 독자들이 조용히 시도하고 있는 통합 작업(integration job)에는 유용하지 않다는 것입니다. 가격을 기준으로 삼은 '2025 年度盘点(2025 연도 결산)'은 140위안이라는 기준점 덕분에 월별 비교가 정직하게 이루어지므로 예산 책정 단계의 작업에 적합합니다. 점수표(scorecard)를 기준으로 한 '12월 IDE 순위'는 등보삼급(等保三级) 준수 여부를 반영했기 때문에 기업 조달 작업에 적합합니다. 별(star) 개수 변화율을 기준으로 한 트렌드 리스트는 이번 달에 모두가 무엇에 별을 눌렀는지 파악하는 작업에 적합하며, 선정 방식의 요약본(picking roundups)들이 완전히 무시했던 WeClone, Agent-S, mem0 등을 수면 위로 끌어올려 줍니다. 하지만 이들은 서로 다른 기준을 교차 검증하는 작업(cross-currency reconciliation job)에는 적합하지 않습니다. 왜냐하면 20달러인 Cursor Pro는 가격 열에는 있지만 트렌드 리스트에는 없고, Claude Code는 점수표 열에는 있지만 트렌드 리스트에는 없으며, Mem0는 트렌드 리스트에는 있지만 나머지 두 열에는 없기 때문입니다. 제가 WeClone이나 Agent-S를 Cursor나 Claude Code만큼 혹독하게 테스트해보지는 않았지만, 공표된 환율표(conversion table) 없이 세 가지의 순위 통화(ranking currencies)가 공존한다는 사실 자체가 구조적인 결함을 보여줍니다.
3개월 후에 다시 평가하겠습니다. 지난번에 제가 이 말을 했을 당시, 저는 코딩에는 주로 Cursor와 Claude Code를, 그 외 모든 것에는 ChatGPT를 사용하고 있었으며, 지금도 대략 그 상태를 유지하고 있습니다. 달라진 점은 이제 2025 Juejin 요약본들을 세 가지의 선정 가이드가 아닌 세 가지의 순위 통화 산출물(artifacts)로 읽고 있으며, 어떤 정보에 따라 행동하기 전에 노트북(notebook)에서 직접 교차 통화 점수 산출(cross-currency scoring)을 수행한다는 것입니다. 6개월 정도 지나면, 요약본들이 교차 통화로 정규화된 점수(cross-currency normalized score)를 발표하거나, 메인 페이지에서 세 가지 형식을 상호 변환해 주는 메타 순위(meta-ranking)를 보여줄 것으로 기대합니다. 그중 어느 쪽이 먼저 움직이느냐에 따라, 이 형식이 엔지니어들이 이미 키보드 위에서 직접 병합(merge) 작업을 수행하고 있다는 사실을 마침내 인지했는지 알 수 있을 것입니다.
AI 자동 생성 콘텐츠
본 콘텐츠는 Dev.to AI tag의 원문을 AI가 자동으로 요약·번역·분석한 것입니다. 원 저작권은 원저작자에게 있으며, 정확한 내용은 반드시 원문을 확인해 주세요.
원문 바로가기