왜 SSR과 Bing이 ChatGPT가 당신의 사이트를 인용할지 결정하는가 (실제 메커니즘)
요약
ChatGPT가 웹 정보를 인용하는 메커니즘을 분석하며, Bing 검색 인덱스와의 연관성을 설명합니다. AI 로봇이 JavaScript를 실행하지 못하는 문제를 해결하기 위해 SSR 또는 SSG 방식의 웹 구축이 필수적임을 강조합니다.
핵심 포인트
- ChatGPT는 자체 인덱스 대신 Bing Search API를 사용하여 정보를 검색함
- ChatGPT-User 로봇은 JavaScript를 실행하지 않으므로 CSR 방식은 인용에 불리함
- AI 최적화를 위해 SSR 또는 SSG를 통한 완전한 HTML 제공이 필요함
- IndexNow 프로토콜을 활용해 Bing 인덱스에 콘텐츠를 즉시 반영할 수 있음
AI 최적화에 관해 기술적으로 해체해 볼 가치가 있는 가설이 하나 있습니다: Google에서 순위가 높으면 ChatGPT 답변에 나타나기에 충분하다는 생각입니다. 그렇지 않습니다. 인프라 수준에서 그 이유를 설명하겠습니다.
ChatGPT는 인덱스를 가지고 있지 않습니다. Bing이 가지고 있습니다.
ChatGPT는 Google 스타일로 웹 인덱스를 구축하는 자체 크롤러(crawler)를 운영하지 않습니다. 모델이 "웹 검색(web search)"을 수행할 때, 파이프라인은 대략 다음과 같습니다:
- 사용자의 질의가 Bing Search API를 통한 검색을 트리거합니다.
- Bing은 자신의 인덱스에서 후보 URL(URL-uri candidate) 세트를 반환합니다.
- ChatGPT-User 로봇이 선택된 페이지에 접속하여 콘텐츠를 추출합니다.
- 모델이 답변을 합성하고 출처를 인용합니다.
Microsoft Copilot도 동일한 Bing 인프라(Prometheus 시스템)를 사용합니다. 결론은 다음과 같습니다: 만약 특정 URL이 Bing 인덱스에 없다면, 그 URL은 후보 세트에 포함되지 않습니다. Google에서 아무리 순위가 높더라도 인용될 수 없습니다.
이는 단순한 이론이 아닙니다. _Seer Interactive_의 연구에 따르면 **ChatGPT/SearchGPT 인용의 약 87%**가 **Bing의 상위 유기적 검색 결과(organic results)**와 일치하는 것으로 나타났습니다.
문제 #1: ChatGPT-User는 JavaScript를 실행하지 않습니다
이것은 가장 자주 간과되는 세부 사항입니다. ChatGPT-User 로봇은 HTML을 페치(fetch)하지만, 완전한 브라우저처럼 JavaScript를 실행하지 않습니다. 따라서 당신의 애플리케이션이 클라이언트 사이드 렌더링(CSR, client-side rendered) 방식, 즉 브라우저에서 하이드레이션(hydration)되는 빈 HTML 셸(shell) 형태라면, 로봇은 다음과 같이 보게 됩니다:
<div id="root"></div>
즉, 아무것도 없습니다. 인용할 **콘텐츠가 제로(0)**입니다.
해결책은 서버 사이드 렌더링(SSR, server-side rendering) 또는 정적 사이트 생성(SSG, static site generation)을 통해, JavaScript가 실행되기 전에 HTML이 이미 채워진 상태로 제공되도록 하는 것입니다:
CSR: 브라우저가 DOM을 구축함 -> AI 로봇은 빈 페이지를 봄
SSR: 서버가 완전한 HTML을 전송함 -> AI 로봇은 모든 콘텐츠를 봄
Next.js를 사용하는 경우, 이는 주요 콘텐츠를 위해 클라이언트 사이드 페치(client-side fetch)에 의존하는 대신 Server Components / SSR / SSG를 사용하는 것을 의미합니다. 이것은 성능의 문제가 아닙니다; AI에게 읽힐 수 있느냐 아니면 보이지 않느냐의 차이입니다.
문제 #2: Bing은 규칙이 다른 것이지, 더 엄격한 것이 아니다
제가 자주 잘못 듣는 교정 사항 중 하나는 Bing이 Google보다 "더 엄격하다"는 것입니다. 역사적으로 Bing은 오히려 더 관대했습니다. 단지 가중치(weights)가 다를 뿐입니다:
- 용어의 정확한 일치(Exact match): Google보다 더 문자 그대로(literal) 가중치를 둡니다.
- 콘텐츠의 신선도(Freshness): 더 높은 비중을 차지합니다.
- 소셜 신호(Social signals): 더 중요한 역할을 합니다.
문제 #3: IndexNow (Google은 무시하는 것)
Bing은 IndexNow를 지원합니다. 이는 크롤링(crawl)을 기다리는 대신, URL이 생성/업데이트/삭제되었음을 엔진에 즉시 알리는 푸시(push) 프로토콜입니다.
POST https://api.indexnow.org/indexnow
Content-Type: application/json
...
Google은 2026년에도 IndexNow를 지원하지 않으며, 여전히 발견 기반의 크롤링(crawl)에 의존합니다. Bing Webmaster Tools에는 Google Search Console가 제공하지 않는 Crawl Control 기능도 있습니다.
AI 가시성을 위한 실무 체크리스트
- 모든 주요 콘텐츠에 SSR/SSG 적용: 로봇이 JavaScript (JS)를 실행하지 않는다고 가정하십시오.
- Google Search Console뿐만 아니라 Bing Webmaster Tools에서도 소유권을 확인하십시오.
- Bing에 사이트맵(sitemap)을 전송하고, 즉각적인 인덱싱(indexing)을 위해 IndexNow를 통합하십시오.
- 인용을 원한다면
robots.txt에서ChatGPT-User(및 Bingbot)를 차단하지 마십시오. - 엔티티(entities)가 모호성 없이 추출될 수 있도록 깨끗한 구조화된 데이터(JSON-LD)를 사용하십시오.
아이러니한 점은 이러한 단계의 대부분이 구현하기 매우 간단하다는 것입니다; 하지만 거의 아무도 이를 실행하지 않습니다. 왜 루마니아 시장이 Google에만 머물러 있는지에 대한 내용을 포함한 전체 분석은 여기에서 확인하실 수 있습니다:
모두가 Google을 위해 최적화합니다. 하지만 ChatGPT는 당신이 누구인지 Bing에게 물어봅니다.
루마니아 Sibiu 소재의 디지털 에이전시, **FLASH SHIP S.R.L.**에서 발행. 사람을 위해 작성된 네이티브 오리지널 콘텐츠입니다. 복사 및 붙여넣기는 없습니다.
AI 자동 생성 콘텐츠
본 콘텐츠는 Dev.to AI tag의 원문을 AI가 자동으로 요약·번역·분석한 것입니다. 원 저작권은 원저작자에게 있으며, 정확한 내용은 반드시 원문을 확인해 주세요.
원문 바로가기