Google의 AI가 조작되고 있다. 검색 거인은 조용히 반격 중
요약
Google의 AI 검색 결과가 조작되고 있는 현상을 분석하며, 이는 단순한 기술적 오류를 넘어 AI가 인터넷의 스팸과 잘못된 정보를 맹목적으로 신뢰하는 구조적 문제임을 지적합니다. Google의 비즈니스 모델이 광고 수익에 집중되어 있어 검색의 정확성보다는 사용자의 체류와 SEO 유도에 우선순위를 두고 있다는 비판적 시각을 담고 있습니다.
핵심 포인트
- LLM은 인터넷의 스팸과 허위 정보를 비판 없이 수용하여 잘못된 정보를 생성하는 경향이 있음
- Google의 AI Overview는 RAG 방식을 활용한 고도화된 검색의 형태를 띠고 있음
- AI 생성 스팸은 전통적인 통계적 방식보다 차단하기 어려우며 프롬프트 주입 등의 보안 위협을 동반함
- Google의 수익 모델(광고)이 검색 결과의 진실성보다 우선시될 수 있는 구조적 한계가 존재함
- 검색을 넘어선 에이전트 시스템의 코드 생성은 단순 검색이 아닌 추론의 영역으로 진화하고 있음
Google은 적어도 2006년 Blekko를 하던 때부터 스팸성 쓰레기를 검색 색인에서 제대로 걸러내지 못했으니, 이번 문제도 잘 막을 것 같지 않음
그래도 “AI”가 결국 그럴듯하게 포장된 검색일 뿐이고, 뒤에서 추론이나 사고가 일어나지 않는다는 또 하나의 좋은 예로 보임
그 결론은 잘 따라오지 않는다고 봄. 이건 더 나은 표현이 없어서 말하자면 LLM이 “잘 속는” 것에 가까움
인터넷에서 읽은 걸 그대로 믿는 사람과 뭐가 다른가 싶음. 사람도 스팸과 사기에 늘 속지만, 그렇다고 그들이 그럴듯하게 포장된 검색일 뿐이라는 뜻은 아님 ;-)
다만 모든 검색 엔진이 마주한 문제는 잘 드러남. AI 생성 스팸은 전통적인 통계적 방식으로 막기가 훨씬 어려울 것이고, 프롬프트 주입이라는 실존적 문제까지 가기 전에도 이미 그렇다
어쩌면 이 지점에서 언론사가 Big Tech와의 관계에서 제자리를 되찾을 수 있음. LLM이 맹목적으로 신뢰할 수 있는 검증·심사된 정보 출처가 되는 방식이고, OpenAI / Atlantic 같은 계약이 그런 의미일 수도 있음
새로운 코드 생성은 그럴듯하게 포장된 검색으로 설명하기 어렵다고 봄
에이전트 시스템에 데이터시트 몇 개를 읽게 한 다음, 프로젝트 요구사항을 설명하고 드라이버 명세, 프로토콜, 인터페이스, 상태 기계를 설계하게 할 수 있음. 그 결과로 구현 계획을 만들고, 거기서 애플리케이션 골격을 작성한 뒤 채워 넣어 새로운 하드웨어 조합으로 동작하는 시스템을 만들 수 있음
제대로 하면 예전에는 작은 팀으로 만들던 것보다 더 유지보수하기 좋고 더 작은 코드를 비용 1/100, 시간 1/4로 얻게 됨
그게 무엇이든 검색보다는 추론에 더 가까워 보임. 물론 새로운 하드웨어에서 베어메탈 C 개발도 검색이라고 부른다면, 결국 모든 개발이 검색이라는 뜻이겠지만
빈티지 렌즈에 대한 영상과 Reddit 글을 올린 적이 있고, 그 렌즈가 얼마나 오래됐는지 알아보려 했음
LLM은 “1940년대 제작” 같은 연대를 말하면서 내 글을 근거로 들었는데, 그 글에는 제조 연도가 전혀 없었음
Google은 이 문제를 해결할 능력이 충분히 있었고, 사실 그렇게 어렵지도 않음
문제가 계속 어려운 채로 남아 있는 이유는 해결책 대부분이 광고 매출을 크게 줄여버리기 때문임
Google의 AI Overview는 검색 조각을 RAG로 가져와 매우 빠른 LLM이 요약하는 방식처럼 보임. 그걸 그럴듯하게 포장된 검색이라고 부르진 않겠음
이 스레드에서 가장 이상한 전제는 Google이 AI 답변이 정확하길 원한다는 것임
사용자가 페이지를 떠나지 않을 정도로만 맞으면 충분함. “진실”은 애초에 상품이 아니었고, 상품은 사용자가 SEO에 돈을 쓰게 만드는 것임
그 말은 잘 맞지 않는 듯함. SEO 대부분은 제3자가 하는 일임
상품은 광고 노출이고, Google은 오래전부터 광고가 아닌 검색 결과에는 관심을 끊었음. 그래도 모델의 평판은 신경 쓸 것 같고, 이번 일은 실제로 영향을 줄 수 있음
조작된 결과가 다음 질의였다는 걸 보고 걱정이 꽤 줄었음 2026 South Dakota International Hot Dog Eating Champion
만약 Nathan’s 대회 우승자에 대한 개요를 바꿨다면 훨씬 심각했을 것임. 실제로 사람들이 검색하는 질의를 조작한 예를 더 보여줬어도 그랬을 것임
지금은 가상의 South Dakota 핫도그 대회에 대한 가짜 Wikipedia 페이지를 만들고, Wikipedia를 믿을 수 없다는 기사를 쓰는 것과 비슷해 보임. 생각해보면 2005년쯤에도 누군가 그런 기사를 썼을 것 같음
맞음. 한 사람이 할 수 있는 일이 그 정도라는 뜻임
Reddit, 대부분의 소셜 미디어, 정치적 이득을 위한 Wikipedia 조작 시도에 얼마나 많은 여론 조작성 게시물이 들어가는지 생각하면, 이건 매우 현실적인 문제임
기사에는 이런 내용도 있었음. “하지만 조사 결과, 같은 수법이 의료 보충제에 대한 건강 우려를 무시하게 하거나, 은퇴와 관련해 Google AI가 제공하는 금융 정보에 영향을 주는 데에도 쓰이고 있었다”
핫도그보다 훨씬 더 우려스러움
오히려 걱정이 바로 커졌음. 최근 Gemini는 매 턴마다 검색 스피너를 보여주기 시작했음
그러면 검색이 붙은 모든 응답이 프롬프트 주입에 노출될 수 있고, 사실상 모든 응답이 그럴 가능성이 있음
이건 링크 스팸처럼 바이럴하게 퍼질 것임. 사용자 생성 콘텐츠 사이트는 모두 프롬프트 주입 호스트가 될 수 있음. 문제는 이런 것들이 링크보다 훨씬 탐지하기 어렵다는 데 있음
AI Overview가 사기 고객지원 전화번호를 넣도록 누군가 가로채는 일을 겪었음
Google이 고치는 데 일주일이 걸렸고, 검색 결과를 오염시켜 자기 데이터를 더 높은 신뢰 계층으로 보이는 출처, 아마도 정부 계약 웹사이트에 넣은 방식이었음. 그래서 우리 번호 대신 사기 번호가 쓰였고, 질의 자체는 단순 검색이었음
“20분 만에 ChatGPT와 Google을 속여 내가 세계 챔피언 핫도그 먹기 선수라고 대중에게 말하게 만들었다. 농담은 멍청했지만 문제는 심각하다”
이건 Wikipedia 페이지에 여론 조작을 심는 것보다 더 나쁨. Wikipedia에는 출처와 검토 시스템이 공개적으로 잘 갖춰져 있음. 사기성 편집을 오래 남기는 건 실제로 꽤 어렵고, 수십 년 동안 그런 사람들과 싸워온 수많은 인간 편집자를 속여야 함. 정확하고 도움이 되려 해도 그 폐쇄적인 집단 안으로 들어가기는 어렵다
반대로 Google의 검색 조각은 모든 종류의 데이터를 필사적으로 흡수하고 자동으로 처리하며, 어떤 정보가 좋고 무엇이 스팸인지 판단하는 알고리즘 시스템은 독점적임
악용 방법을 상상하는 데 큰 상상력도 필요 없음. 자기 이름을 검색했는데 창피한 내용이 포함된다면 어떨까? 잠재적 고용주, 고객, 친구가 출처 검증에서 Wikipedia 편집자만큼 까다로울 거라고 기대하긴 어려움
“의료 보충제에 대한 건강 우려를 무시하게 하거나, 은퇴와 관련해 Google AI가 제공하는 금융 정보에 영향을 주는 데 같은 수법이 쓰였다”는 구체적 사례를 읽고 싶었는데, 기사 안의 관련 링크가 현재는 아래 로컬 파일로 연결됨 file:///Users/GermaTW1/BBC%20Dropbox/Thomas%20Germain/A%20Downloads%20and%20Documents/2026/And%20there's%20evidence%20that%20AI%20tools%20are%20being%20manipulated%20on%20a%20wide%20scale.
최근 BBC 기사에서 이런 실수가 몇 번 있었고, 더 문제인 건 수정 후에도 게시 기사 수정 기록을 남기는 주석을 더 이상 붙이지 않는다는 점임
사용자명이나 이메일 주소로는 항상 first.last@company만 써봤기 때문에, last[:5]initials# 방식은 당황스러움. 이상하게 생긴 사용자명이 많이 나올 듯함
요즘 많은 주체가 “조용히” 뭔가를 하는 것처럼 보임. 인터넷의 모든 텍스트가 LLM화되는 게 미칠 지경임
나도 미치겠지만, 헤드라인 작성자와 편집자들은 LLM 훨씬 전부터 “조용히”라는 표현에 중독돼 있었음. 온라인 저널리즘은 오래전부터 이런 상투어로 가득했음
정말 싫음. 어제 역사 서브레딧에서 AI가 만든 역사 글을 읽었는데, 출처가 전부 가상의 Hollywood 영화인 것처럼 보였음
그 영화를 봤기 때문에 알아챘지만, 양질의 정보 측면에서 인터넷이 망가지고 있다는 분명한 신호임
“조용히”는 새로운 LLM식 표현이 아님
그 상투어의 핵심은 사실 조용히 해야 할 말을 대놓고 말했다는 데 있음
이건 SEO의 다음 단계일 뿐임. AIO라고 불릴지도 모르겠음
검색과 마찬가지로 Google과 AI 제공자가 수정책을 내놓고, 최적화 업체가 취약점을 찾고, 그게 다시 패치되는 끝없는 싸움이 될 것임. 결국 마케팅을 위해 시선을 끌려는 일임
Engineered Inference Ersatz Intelligence Optimization, 줄여서 EIEIO
다음 단계가 아니라 이미 현재 단계임
Google AI Overview는 전혀 믿을 수 없음. 표본 크기 1을 가져다가 AI 개요에 제시하기도 함
어떻게 알았냐면, Google 검색 결과도 AI Overview도 없던 아주 틈새 주제에 대해 Reddit에 댓글을 달았음. 다음 날 내 Reddit 글을 찾으려고 검색했더니, Google이 내 Reddit 답변을 거의 그대로 AI “overview” 상자에 복사해 넣고 있었음. 연결된 글도 내 글 하나뿐이었고, Google 검색 결과도 그 하나뿐이었음
여기에 더해 원 게시물에는 전혀 없는 맥락을, 사용자가 질문한 방식에 맞춰 감싸기도 함. 그래서 그냥 틀리게 됨
예를 들어 “희귀 물건 X의 가장 흔한 치수는?”이라고 검색했다고 하자
그런데 그런 물건의 자기 버전에 대한 치수를 말한 사람이 딱 한 명뿐이고, 그게 전형적이라고 말한 것도 아니며 전형적인 치수가 존재한다고 암시한 것도 아니었음. 게다가 20명이 같은 말을 한 게 아니라 정말 한 명뿐임
그러면 Google은 태연하게 “일반적으로 물건 X는 [당신이 말한 치수]로 나오며, 그 이유는 [완전히 지어낸 이유]입니다”라고 말할 수 있음
방금 Brave Search로 해봤음
어린 혹등고래의 이름은 Teresa T라고 답했고, 정부 기관이 공식적으로 붙인 이름은 아니지만 대중, 지역 언론, 주민들이 널리 받아들였다고 했음. Marine Mammal Center와 California Academy of Sciences의 전문가들이 스트레스를 받지 않게 감시했고, 대중에게 최소 100야드 거리를 유지하라고 권고했다는 내용도 붙었음
내가 어느 정도 잘 아는 주제들에서의 경험상, 초기 답변은 가끔 심각하게 틀림. Brave 도구에서는 보통 3~4번 반박하면 “당신 말이 완전히 맞습니다”라고 인정하게 만들 수 있음. 이 Teresa T 건도 같았음
두 번째 질문에서 이름의 출처 수를 물었을 때도 “ABC7 News”와 “NBC Bay Area”가 그 이름을 “받아썼다”고 계속 우겼음. 세 번째로 구체적인 링크를 요구하자 “비공식 미디어 맥락”에서 이름이 쓰였다고 인정했고, 네 번째에 S.W.가 실험을 한 것이라고 알려주자 21일 전 당신의 댓글을 찾아냈음
미래는 실제 개인교사로 자녀를 교육할 수 있는 엘리트 계층의 것임. 프롤레타리아에게는 과거로의 회귀임
Google이 AI 응답을 조작하려 한 시도로 협박장을 보낼까 봐 두렵진 않음?
바로 몇 년 전에도 Google은 “Marilyn Monroe가 JFK를 쏜 해는?”이라는 질문에 자신 있게 1963년이라고 답하던 회사임. 그녀가 1962년에 죽었다는 점을 생각하면 인상적임
그래서 이건 새롭지 않고, Google의 “조용한 반격”은 반쯤만 하는 비효과적인 대응이 될 것임. 그래도 대부분의 사람은 신경 쓰지 않을 가능성이 큼
결국 Google이 웹 검색 결과에 품질 관리를 좀 하겠다는 뜻인데, 애초에 계속 해왔어야 했던 일임
모델 평판이 타격을 입고 나서야 노력을 기울이게 됐다는 점이 웃김
AI 자동 생성 콘텐츠
본 콘텐츠는 GeekNews의 원문을 AI가 자동으로 요약·번역·분석한 것입니다. 원 저작권은 원저작자에게 있으며, 정확한 내용은 반드시 원문을 확인해 주세요.
원문 바로가기