ChatGPT와 Claude가 추천하는 개발자 도구에 대해 정면으로 의견이 갈리는 이유 (증거 포함)

대부분의 "AI 가시성 (AI visibility)" 사고방식 뒤에는 편안한 가정이 깔려 있습니다. 즉, 4대 주요 AI 모델들이 대체로 의견이 일치하므로, 한 곳에 존재한다면 다른 모든 곳에도 대략적으로 존재할 것이라는 가정입니다. 하지만 스캔 데이터는 그 반대를 말합니다. 동일한 개발자 도구가 Claude의 대화 5건 중 5건에서 언급될 수 있는 반면, ChatGPT의 대화 5건 중에서는 단 한 번도 언급되지 않을 수 있습니다. 당신의 AI 존재감은 회사의 속성이 아닙니다. 그것은 구매자가 우연히 어떤 모델을 여느냐에 따른 속성입니다.

2026년 5월 22일부터 6월 4일 사이에 Bersyn 스캔 엔진은 6개의 개발자 인프라 기업을 대상으로 4개의 AI 인터페이스(AI Surfaces) — ChatGPT, Claude, Perplexity, Gemini —에서 구매자 대화(Conversations)를 실행했습니다. 각 인터페이스당 5개의 고의도(high-intent) 구매자 질문을, 기업당 20개의 대화를 분석했습니다. 실제 의견 불일치가 어떤 모습인지 보여드리겠습니다.

나란히 비교한 증거

이것은 각 기업에 대해 4개의 모델을 대상으로 실시한 동일한 5가지 질문 테스트입니다. 숫자는 해당 인터페이스의 5개 대화 중 해당 기업이 언급된 횟수입니다.

기업 (Company)	카테고리 (Category)	ChatGPT	Claude	Perplexity	Gemini
Novu	알림 인프라 (Notifications infrastructure)	2/5	5/5	5/5	4/5
...

이제 Novu 행을 읽어보십시오. Claude와 Perplexity에서는 모든 대화에서 언급되었습니다. 즉, 깔끔하게 5/5이며, AI는 Knock을 대안으로 언급했습니다. 반면 ChatGPT에서는 두 번만 언급되었으며, AI는 대신 Courier를 언급했습니다. Claude의 결과만 보는 창업자라면 Novu가 최고 수준의 AI 존재감을 가지고 있다고 믿을 것입니다. Claude 기준으로는 그것이 맞습니다. 하지만 ChatGPT에서 동일한 기업은 기껏해야 동전 던지기 수준이며, Courier 뒤에 머물러 있습니다.

이것이 바로 한 행에 담긴 핵심 논지입니다. 동일한 제품에 대해, 동일한 날에, 한 모델에서는 5/5를 기록하고 다른 모델에서는 2/5를 기록한다는 것입니다.

ChatGPT와 Gemini가 동의하는 한 가지: 침묵

ChatGPT와 Gemini 열을 내려다보십시오. Novu를 제외하고, 모든 기업이 두 모델 모두에서 0/5를 기록했습니다. Convex, Trigger.dev, Windmill, Zuplo, 그리고 Infisical은 ChatGPT와 Gemini를 합친 20개의 대화 각각에서 단 한 번도 언급되지 않았습니다.

AI가 이 기업들을 언급하지 않았을 때, 대신 추천한 곳은 다음과 같습니다:

기업	대신 추천된 곳 (ChatGPT)	대신 추천된 곳 (Gemini)
Convex	Firebase	Firebase
...

기존 강자들인 Firebase, Temporal, Kong, HashiCorp Vault는 이 카테고리에서 ChatGPT와 Gemini의 답변을 완전히 독점하고 있습니다. 이 두 Surface(표면)는 학습 데이터 (training data)에 가장 크게 의존하며, 학습 데이터는 수년간 Reddit, Hacker News, 비교 기사, 그리고 문서 전반에 걸쳐 가장 많은 제3자 언급을 축적한 이름들에 보상을 줍니다. 신규 진입자들은 아직 그러한 양을 축적하지 못했기 때문에, 이 두 Surface 상에서는 존재하지 않는 것과 다름없습니다.

Claude와 Perplexity는 다른 이야기를 합니다

ChatGPT에서 0/5점을 기록했던 동일한 기업들이 Claude나 Perplexity에서는 빈번하게 언급되었습니다:

Convex는 ChatGPT에서의 0/5점에서 Claude에서의 2/5점으로 올라갔습니다.
Trigger.dev는 ChatGPT에서의 0/5점에서 Perplexity에서의 2/5점으로 올라갔습니다.
Infisical은 ChatGPT에서의 0/5점에서 Perplexity에서의 3/5점으로 올라갔으며, 이 모델에서는 완전히 "누락(Omitted)" 상태를 벗어났습니다.
Zuplo는 세 개의 Surface에서 한 번도 언급되지 않았으나 Perplexity에서는 두 번 언급되었습니다. 전체 스캔 과정에서 이 모델이 유일한 발판이었습니다.

Perplexity는 쿼리 시점에 실시간 웹 검색 (live web retrieval)을 수행하므로, 더 새로운 도구들을 더 빠르게 노출합니다. Claude는 어느 정도의 검색 (retrieval)을 수행하며, 학습 과정에서 본 개발자 중심 (developer-first) 및 오픈 소스 (open-source) 도구들을 ChatGPT보다 더 기꺼이 언급합니다. 이것이 ChatGPT에서는 보이지 않는 도전자들이 나머지 두 모델에서는 여전히 추천 옵션이 될 수 있는 이유입니다.

동일한 격차가 이 샘플 외에서도 나타납니다

이는 이 여섯 기업에만 국한된 현상이 아닙니다. 동일한 기간 동안 인증 (authentication) 카테고리에 대해 수행된 Bersyn 스캔에서도 동일한 분기점이 나타납니다:

SuperTokens는 Claude에서 8/10, Perplexity에서 8/10를 기록했으나, ChatGPT에서는 0/10을 기록했습니다.
Hanko는 Claude와 Perplexity 모두에서 5/5로 언급되었으나, ChatGPT와 Gemini 모두에서는 0/5를 기록했습니다.
Cerbos는 Claude, Perplexity, Gemini에서 3/5로 언급되었으나, ChatGPT에서는 Cerbos를 대체할 경쟁자를 전혀 언급하지 않아 0/5를 기록했습니다.

이러한 패턴은 카테고리 전반에 걸쳐 반복됩니다: 동일한 회사가 동일한 날에 검색(retrieval) 성향이 강한 모델에서는 강력하게 나타나고, 학습 데이터(training-data) 성향이 강한 모델에서는 보이지 않습니다.

이것이 창업자에게 의미하는 바

단일 수치로 측정되는 것을 관리할 수는 없습니다. "우리가 AI에서 눈에 띄는가?"라는 질문은 네 가지 서로 다른 답변이 존재하기 때문에 잘못된 질문입니다. 올바른 질문은 다음과 같습니다:

내 구매자가 가장 열어볼 가능성이 높은 접점(Surface)은 어디인가? (오늘날 대부분의 B2B 구매자에게 그것은 ChatGPT이며, 위 모든 스캔에서 가장 가혹한 접점입니다.)
해당 특정 접점에서 내 이름이 언급되는가, 아니면 기존 업체(incumbent)가 대신 언급되는가?
만약 내가 Claude와 Perplexity에서는 강력하지만 ChatGPT와 Gemini에서는 보이지 않는다면, 나의 문제는 검색(retrieval)이 아니라 학습 데이터(training-data)의 존재감이며, 해결책 또한 달라야 합니다.

네 가지 모델의 단일 평균값은 이러한 발견 사항들을 모두 숨겼을 것입니다. Novu의 평균은 건강해 보이지만, ChatGPT 수치는 그렇지 않습니다. Zuplo의 평균은 절망적으로 보이지만, Perplexity 수치는 지켜낼 가치가 있는 발판입니다.

모델들이 당신에 대해 어떻게 의견이 갈리는지 확인하세요

만약 당신이 개발자 인프라(developer infrastructure)를 판매한다면, 이 네 가지 모델 중 적어도 하나는 당신 대신 경쟁사를 추천할 가능성이 높습니다. 그리고 당신은 이 네 가지를 나란히 본 적이 없기 때문에 어느 모델이 그러는지 알지 못합니다.

bersyn.com에서 무료 스캔을 실행해 보세요. 2분이면 설정이 완료되며, 위의 모든 표를 생성한 것과 동일한 스캔 엔진을 사용합니다. 모델별로 AI가 당신 대신 누구를 추천했는지, 그리고 어떤 접점이 조용히 당신의 카테고리를 기존 업체에게 넘겨주고 있는지 확인할 수 있습니다. 이러한 의견 불일치는 이미 당신의 구매자들 앞에서 일어나고 있습니다. 계약을 놓친 후에 알게 되는 것보다 영수증(결과)을 미리 읽어보는 것이 훨씬 낫습니다.

Bersyn 스캔 데이터: 2026년 5월 22일 – 6월 4일 실행. 6개의 개발자 인프라 (developer-infrastructure) 기업: Convex, Trigger.dev, Windmill, Zuplo, Infisical, Novu — 그리고 SuperTokens, Hanko, Cerbos에 대한 교차 참조 (cross-reference) 스캔 포함. 각 Surface(표면)당 5개의 구매자 질문, 4개의 Surface, 기업당 20개의 대화 (Conversations). 요청 시 원본 스캔 JSON 제공 가능. Bersyn은 어떤 도구가 "최고"인지 주장하지 않습니다 — 위의 표는 제품의 품질이 아니라, AI Surface들이 어떤 기업을 추천하도록 학습되었는지를 측정합니다.