GA4 전환 설정 기초부터 시작하기: 아무도 말하지 않는 데이터 무결성의 거짓말 해결하기
요약
GA4 설정이 완벽하더라도 Measurement ID를 이용해 Google 서버로 직접 이벤트를 전송하는 '유령 트래픽(Ghost Traffic)' 문제를 다룹니다. 봇과 AI 에이전트가 생성하는 조작된 데이터가 데이터 무결성을 해치고 마케팅 의사결정을 왜곡하는 원인을 분석합니다.
핵심 포인트
- 표준 설정(WAF, 서버 측 GTM)으로는 Measurement Protocol을 통한 직접 전송을 막을 수 없음
- 유령 트래픽은 GA4 내장 봇 필터를 우회하여 데이터 왜곡을 초래함
- AI 에이전트 트래픽이 direct 유입으로 오분류되어 전환율 및 입찰 전략에 악영향을 미침
- 단순한 설정 완성을 넘어 데이터 소스의 품질과 무결성 확보가 필수적임
가이드들이 틀린 것은 아닙니다. 그들이 설명하는 설정 방식은 정확합니다. 올바르게 구성된 GA4 속성이라 할지라도 여전히 쓰레기 데이터를 측정하고 있을 수 있습니다.
아무도 이를 직접적으로 지목하지 않지만, 문제는 설정이 아닙니다. 설정을 통해 흐르는 데이터가 문제입니다. 모든 튜토리얼은 태그가 올바르게 실행된다면 GA4에 도착하는 이벤트가 실제 인간의 행동을 나타낸다고 가정합니다. 그 가정은 2026년에 깨졌습니다. 이를 바로잡으려면 왜 그런 일이 발생하는지 이해해야 합니다.
설정 가이드 어디에도 언급되지 않은 유령 트래픽(Ghost Traffic) 문제
2026년 초, Cloudflare는 봇 트래픽이 미국 전체 인터넷 트래픽의 45%에 달했다고 보고했습니다. 수치 자체보다 중요한 것은 그 메커니즘입니다. 최악의 트래픽은 귀하의 사이트를 방문조차 하지 않습니다. 이들은 귀하의 페이지 소스에 포함되어 있어 페이지를 한 번만 로드하는 어떤 스크립트라도 쉽게 읽을 수 있는 공개 Measurement ID를 사용하여 Google 서버로 조작된 이벤트를 직접 전송합니다.
이를 유령 트래픽 (Ghost Traffic)이라고 부르며, 이는 표준 설정 가이드에서 권장하는 모든 방어 체계로부터 설계상 면역되어 있습니다. GA4의 내장 IAB 봇 필터는 이를 잡아내지 못하는데, 이벤트가 정당한 Measurement Protocol 히트로 보이기 때문입니다. 귀하의 Cloudflare WAF도 이를 잡아내지 못하는데, 요청이 귀하의 오리진(Origin)에 전혀 닿지 않기 때문입니다. 서버 측 GTM (Server-side GTM)도 이를 잡아내지 못하는데, 이벤트가 귀하의 서버를 완전히 우회하기 때문입니다. 귀하는 모든 것을 올바르게 설정했습니다. 하지만 귀하의 GA4 속성에 도착하는 데이터에는 여전히 참여 시간이 0초이고, 기계적으로 일관된 스크롤 패턴을 보이며, Stripe 결제 내역과 일치하지 않는 구매 이벤트가 발생하는 Lanzhou, Singapore, Ashburn 지역의 세션들이 포함되어 있습니다.
실질적인 결과는 다음과 같습니다. 실제 전환율이 3%인 사이트라도 세션의 3분의 1이 봇에 의해 생성된다면 전환율이 2%인 것처럼 보일 수 있습니다. 이 차이는 예산 배분을 변화시킵니다. 귀하가 Google Ads로 보내는 잠재고객 신호 (Audience signals)를 변화시킵니다. 입찰 전략 (Bidding strategies)이 마땅히 받아야 할 가치를 변화시킵니다. 귀하는 설정을 해결했습니다. 하지만 아무도 물(데이터의 근원)을 해결하지 못했습니다.
ChatGPT Ads Manager는 자체적인 CAPI 통합 기능과 함께 2026년 5월 5일에 출시되었으며, 현재 LLM 트래픽의 70.6%가 GA4에서 direct(직접 유입)로 잘못 분류되고 있습니다. 당신은 단순히 봇(bot)을 세고 있는 것이 아닙니다. 당신의 사이트를 크롤링하는 AI 에이전트(AI agents)를 세고 있으며, 그들의 세션(session)을 organic(자연 유입) 또는 direct(직접 유입)로 귀속시키고 있는 것입니다. 당신의 GA4 속성(property)은 인간, 봇, 그리고 AI 에이전트가 뒤섞인 상태를 측정하도록 아름답게 구성된 도구일 뿐이며, 이들을 구분해낼 수 없습니다.
이 가이드가 실제로 다루고자 하는 것이 바로 이것입니다. 올바른 GA4 설정의 메커니즘은 중요합니다. 하지만 그것은 기본 요건(table stakes)일 뿐입니다. 모든 단계의 밑바탕에 깔린 질문은 이것입니다: 이 올바르게 설정된 속성에 도달하는 데이터의 품질은 어떠한가?
빠른 답변
GA4는 봇 트래픽을 자동으로 필터링하나요?
GA4는 IAB/ABC International Spiders and Bots List에 등록된 알려진 봇들을 필터링합니다. 하지만 Puppeteer나 Playwright를 실행하는 headless browser(헤드리스 브라우저), 인간의 행동을 모방하는 residential proxy(주거용 프록시), 또는 Measurement Protocol 엔드포인트로 직접 전송되는 ghost traffic(고스트 트래픽)은 잡아내지 못합니다. 2025년 1분기 데이터에 따르면, 비인간(non-human) 트래픽의 42%가 현재 인간의 마우스 움직임을 성공적으로 모방하고 있습니다. 내장된 필터는 출발선이지 결승선이 아닙니다.
server-side GTM이 데이터 품질 문제를 해결하나요?
부분적으로 그렇습니다. server-side GTM(서버 측 GTM)은 태그 실행을 브라우저 외부로 이동시키므로, 광고 차단기(ad blockers)가 해당 요청을 가로챌 수 없습니다. 또한 이벤트를 GA4 및 광고 플랫폼으로 전달하기 전에 검증하고 중복을 제거(deduplicate)할 수 있게 해줍니다. 하지만 하지 못하는 것도 있습니다: Measurement Protocol을 통해 서버를 완전히 우회하는 ghost traffic을 필터링할 수 없으며, 봇 IP 데이터베이스를 보유하고 있지도 않습니다. 당신은 차단된 이벤트를 복구하는 것이지, 사기성(fraudulent) 이벤트를 자동으로 제거하는 것이 아닙니다. 파이프는 더 깨끗해지지만, 물은 여전히 섞여 있습니다.
2026년에 Consent Mode v2가 필수인가요?
EEA(유럽 경제 지역) 트래픽의 경우, 그렇습니다. Google은 2026년 6월 15일부로 Google Ads를 운영하는 모든 EEA 광고주에게 이를 의무화했습니다. CNIL(프랑스 데이터 보호 기구)은 동의 처리 실패를 이유로 2025년 9월 Google에 3억 2,500만 유로의 과징금을 부과했습니다. 이 규제는 실질적인 강제력을 가집니다. EEA 외부에서 Consent Mode (동의 모드)는 광고 측정 신호 품질을 위한 권장 사항(best practice)이며, 법적 요구 사항은 아닙니다.
왜 내 GA4 전환 데이터는 광고 플랫폼의 수치와 일치하지 않나요?
여러 가지 이유가 서로 복합적으로 작용합니다. 귀하의 GA4 스크립트는 실제 사용자 세션의 25%에서 35%에 달하는 비율로 광고 차단기(ad blockers)에 의해 차단됩니다. 픽셀 기반의 전환(pixel-based conversions) 또한 동일한 비율로 차단됩니다. 만약 Meta와 Google Ads를 위해 GA4와 별개로 서버 측 CAPI (Server-side CAPI)를 구성하지 않았다면, 두 플랫폼 모두 동일하게 누락된 클라이언트 측(client-side) 뷰만을 보게 됩니다. 한편, 봇(bot) 세션은 실제 전환에는 기여하지 않으면서 세션 분모를 부풀려, 눈에 보이는 전환율을 억제합니다. 수치들이 서로 다른 이야기를 하는 이유는 그것들이 서로 다른 것을 측정하고 있기 때문입니다.
GA4 핵심 이벤트 (key event)와 Google Ads 전환의 실제 차이점은 무엇인가요?
GA4 핵심 이벤트 (이전에는 GA4 인터페이스에서 전환(conversions)이라 불림)는 분석을 위한 행동 신호(behavioral signals)입니다. Google Ads 전환은 Google의 입찰 알고리즘(bidding algorithm)이 능동적으로 최적화하는 대상인 이벤트입니다. GA4 핵심 이벤트를 Google Ads로 가져올(import) 수 있지만, 전달되는 신호의 품질은 귀하의 GA4 데이터가 얼마나 깨끗한지에 달려 있습니다. 봇에 의해 부풀려진 이벤트를 가져오면, 스마트 입찰(Smart Bidding)이 귀하의 봇과 유사해 보이는 트래픽을 더 많이 찾도록 학습하게 됩니다. 알고리즘은 귀하가 제공하는 데이터만큼만 성능을 발휘할 뿐입니다.
표준 클라이언트 측 추적(client-side tracking)은 전환 데이터를 얼마나 놓치나요?
서버 측 복구(server-side recovery)를 위해 인용되는 일반적인 수치는 20%에서 40% 사이입니다. DarwinApps의 2026년 연구에 따르면, 한 스킨케어 브랜드는 클라이언트 측 태깅(client-side tagging)만 사용했을 때 1,724건의 구매를 기록한 반면, 서버 측 전환 추적을 사용했을 때는 4,512건의 GA4 구매를 기록했습니다. 이는 복구된 이벤트가 162% 증가했음을 보여줍니다. 이 격차는 실재하며, ROAS (광고비 대비 매출액) 계산을 실질적으로 바꿀 수 있을 만큼 큽니다.
GA4가 중단되나요?
아니요. GA4는 Google의 현재 플랫폼이며 중단되지 않습니다. 문제는 GA4가 작동하느냐가 아닙니다. 올바르게 설정된 GA4 속성(Property) 내부의 데이터가 현실을 반영하고 있느냐 하는 것입니다.
GA4 설정이 실제로 실패하는 5가지 지점
태그 설정을 하나라도 건드리기 전에 이러한 실패 모드(Failure modes)를 이해하면 나중에 디버깅(Debugging) 시간을 절약할 수 있습니다. 대부분의 GA4 설정은 이 지점들 중 하나 이상에서 실패하며, 어떤 지점이 문제를 일으키는지 정확히 식별하는 것이 무엇을 수정해야 할지를 알려줍니다.
클라이언트 측 스크립트 차단 (Client-side script blocking). 귀하의 GA4 태그는 Google의 분석 도메인에서 제공되는 제3자 스크립트(Third-party script)입니다. uBlock Origin, Brave Shields, Pi-hole 등은 해당 스크립트의 정확한 URL을 알고 있으며 이름으로 이를 차단합니다. 실제 인간 방문자의 25%에서 35% 사이가 단 하나의 GA4 이벤트도 발생시키지 못합니다. 차단된 세션은 아예 나타나지 않기 때문에 보고서에서는 이 현상이 보이지 않습니다. 즉, 세션 수는 과소평가되고, 이탈률(Bounce rates)은 왜곡되며, 퍼널(Funnel) 데이터에는 구멍이 생깁니다.
동의 모드 신호 손실 (Consent Mode signal loss). Consent Mode v2가 구성되어 있고 EEA(유럽 경제 지역) 방문자가 쿠키를 거부하면, GA4는 관찰된 이벤트(Observed events) 대신 모델링된 데이터(Modeled data)를 수신합니다. 모델링은 아무것도 없는 것보다는 낫지만, 실제 데이터와 동일하지는 않습니다. 보고된 EU 전환 데이터 중 모델링된 데이터와 관찰된 데이터의 비율은 전적으로 귀하의 동의 수락률(Consent acceptance rate)에 달려 있으며, 대부분의 GA4 속성은 그 수락률이 얼마인지조차 알지 못합니다.
CMP 스크립트 차단 (CMP script blocking). 귀하의 동의 관리 플랫폼(CMP, Consent Management Platform)은 거의 확실하게 벤더의 CDN(Content Delivery Network)에서 제공되는 제3자 스크립트입니다. OneTrust는 자체 CDN 도메인에서 로드됩니다. Cookiebot은 자체 동의 도메인에서 로드됩니다. uBlock Origin과 Brave는 이러한 도메인을 30~40%의 확률로 차단합니다. CMP 스크립트 로드에 실패하면 동의 배너가 나타나지 않습니다. 동의가 기록되지 않습니다. 해당 세션에 대해 추적(Tracking)이 전혀 실행되지 않으며, 세션 자체가 기록되지 않았기 때문에 데이터상으로는 그 실패를 확인할 수 없습니다.
고스트 트래픽 주입 (Ghost traffic injection). 위에서 다루었습니다. 귀하의 공개 측정 ID (Measurement ID)를 사용하여 측정 프로토콜 (Measurement Protocol) 엔드포인트로 조작된 이벤트를 게시하는 방식입니다. 방문이 필요하지 않습니다. 귀하가 구축한 모든 방어 체계는 서버와 브라우저 사이에 위치합니다. 고스트 트래픽은 이 둘을 모두 우회합니다.
봇 전환 신호 오염 (Bot conversion signal contamination). 귀하의 사이트에 도달하는 봇 세션은 실제 이벤트를 발생시킵니다. 만약 봇이 체크아웃 흐름 (checkout flow)을 완료하면, GA4는 이를 구매 (purchase)로 기록합니다. 만약 해당 구매 이벤트를 Google Ads로 가져오면, Google의 알고리즘은 이를 학습 신호 (training signal)로 사용합니다. 2025년 10월에 완전히 배포되는 Project Andromeda는 이제 오염된 입찰 신호 (bidding signals)에 대해 몇 시간 내에 반응합니다. 봇 전환 데이터를 입력하면, 알고리즘은 귀하의 봇과 유사해 보이는 트래픽을 더 많이 찾아냅니다. 이는 이론적인 문제가 아닙니다. PillarlabAI는 4주 동안 4,560건의 가입을 기록했는데, 그중 실제 인간은 730명뿐이었으며, 650개의 사기 계정은 단 한 대의 노트북에서 발생한 것으로 추적되었습니다. 그 가짜 가입들은 실제 이벤트를 발생시키고 있었습니다. 만약 이 데이터가 CAPI로 흘러 들어갔다면, 알고리즘은 동일한 유형을 더 많이 찾도록 학습되었을 것입니다.
올바른 GA4 전환 설정, 단계별 가이드
아래의 메커니즘은 정확합니다. 다음 순서대로 수행하십시오. 그 후, 이 메커니즘이 해결할 수 없는 문제에 관한 섹션을 읽으십시오.
1단계: 한 가지 설치 방법을 선택하고 중복 태깅 (double-tag)을 하지 마십시오.
GA4는 사이트 코드에 직접 Google 태그를 설치하거나, Google 태그 관리자 (Google Tag Manager, GTM)를 통해 설치합니다. Shopify Google 채널을 사용하는 경우 GA4가 네이티브로 설치됩니다. 하나만 선택하십시오. 만약 CMS 플러그인이 GA4를 주입하고 있는데 귀하가 GTM을 추가한다면, 실시간 (Realtime) 보고서에서 중복된 page_view 이벤트를 보게 될 것입니다. 중복된 이벤트는 모든 하위 보고서를 오염시킵니다. 설치 직후 실시간 보고서를 확인하십시오. 페이지 로드당 하나의 page_view가 있어야 합니다. 만약 두 개가 보인다면, 하나의 설치 방식은 제거해야 합니다.
2단계: 데이터 스트림 (data stream)을 구성하고, 수동으로 추적할 이벤트에 대해서는 향상된 측정 (Enhanced Measurement)을 끄십시오.
향상된 측정(Enhanced Measurement)은 스크롤, 외부 클릭, 파일 다운로드, 동영상 참여, 양식 상호작용에 대한 이벤트를 자동으로 발생시킵니다. 듣기에는 좋아 보입니다. 문제는 자동 발생 이벤트는 매개변수화(parameterized)되어 있지 않다는 것입니다. 구매 이벤트가 수익(revenue), 통화(currency), 상품 데이터(item data)를 포함해야 한다면, 향상된 측정만으로는 이를 처리해 주지 않습니다. GTM이나 데이터 레이어(data layer)를 통해 수동으로 구성할 의도가 있는 모든 이벤트에 대해 향상된 측정을 끄고, 그 후에 제대로 구축하십시오. 그리고 진정으로 자동 추적되기를 원하고 매개변수화된 데이터가 필요 없는 이벤트에는 활성화하십시오.
3단계: 태그가 발생하기 전에 이커머스 데이터 레이어를 구축합니다.
GA4 이커머스 추적은 모든 퍼널 이벤트(funnel event)에 대해 구조화된 데이터 레이어 푸시를 요구합니다. 즉, view_item, add_to_cart, begin_checkout, add_payment_info, purchase입니다. 구매 이벤트는 통화(currency), transaction_id, value, 그리고 최소한 item_id, item_name, price를 포함하는 items 배열을 반드시 가져야 합니다. 누락된 통화 매개변수(Missing currency parameter)가 수익 보고서가 0으로 나오는 가장 흔한 원인입니다. 이벤트는 발생하지만, 수익은 null로 표시됩니다. 수익에 의존하는 모든 하위 보고서(downstream report)가 손상됩니다. GTM에서 단 하나의 태그를 구성하기 전에 데이터 레이어 구조를 구축하십시오.
Shopify의 경우, Shopify가 App Pixel 기본 설정을
GA4에서는 어떤 이벤트든 핵심 이벤트 (key event)로 지정할 수 있으며, Google Ads는 모든 핵심 이벤트를 전환 (conversion)으로 가져올 수 있습니다. 위험한 점은 page_view나 add_to_cart와 같은 상위 단계 (upstream) 이벤트들을 핵심 이벤트로 지정한 뒤 이를 Google Ads로 가져오는 것입니다. Google의 입찰 알고리즘 (bidding algorithm)은 사용자가 전환이라고 말하는 대상에 맞춰 최적화됩니다. 페이지 뷰 (page views)를 향해 최적화하면 구매 의도가 없는 저렴한 트래픽만 얻게 될 것입니다. 실제 비즈니스 결과 (business outcomes)를 나타내는 이벤트만 지정하십시오. 대부분의 이커머스 (ecommerce) 설정의 경우: purchase. 리드 생성 (lead gen)의 경우: 퍼널 (funnel) 내의 의미 있는 시점에서의 qualified_lead 또는 form_submission을 지정해야 하며, 모든 양식 상호작용 (form interaction)을 지정해서는 안 됩니다.
5단계: EEA 트래픽을 위한 동의 모드 (Consent Mode) v2 설정하기.
EEA (유럽 경제 지역)를 대상으로 하는 모든 설정에는 GA4에 동의 신호를 올바르게 전달하는 CMP (동의 관리 플랫폼)가 필요합니다. GA4에 필요한 동의 신호는 analytics_storage 및 ad_storage입니다. 두 신호가 모두 거부되면 GA4는 모델링된 데이터 (modeled data)를 수신합니다. 만약 CMP가 동의 모드 (Consent Mode)와 올바르게 통합되지 않았다면, GA4는 동의가 설정되지 않은 것처럼 동작하며 귀하는 EEA 내에서 법적 보호 없이 운영하는 것이 됩니다.
2026년 6월 15일 Google Ads 마감 기한으로 인해 모든 EEA 광고업체에게 동의 모드 (Consent Mode) v2가 의무화되었습니다. 적절하게 통합된 동의 모드 (Consent Mode) v2 설정 없이 EEA 국가를 대상으로 Google Ads를 운영하고 있다면, 귀하의 캠페인은 규정을 준수하지 않는 것이며 해당 시장에 대한 전환 데이터는 신뢰할 수 없습니다.
6단계: 서버 측 (server-side) GA4 및 Google Ads 향상된 전환 (Enhanced Conversions) 구현하기.
AI 자동 생성 콘텐츠
본 콘텐츠는 Dev.to AI tag의 원문을 AI가 자동으로 요약·번역·분석한 것입니다. 원 저작권은 원저작자에게 있으며, 정확한 내용은 반드시 원문을 확인해 주세요.
원문 바로가기