본문으로 건너뛰기

© 2026 Molayo

arXiv논문2026. 05. 01. 15:26

생성형 AI 가 검색을 어떻게 교란시키는지: Google 검색, Gemini, 및 AI 개요에 대한 경험적 연구

요약

본 연구는 생성형 AI가 웹 검색을 어떻게 교란시키는지 이해하기 위해 Google 검색, Gemini, 그리고 AI 개요(AIO)의 결과를 비교 분석했습니다. 11,500개의 사용자 쿼리를 사용한 이 연구에 따르면, AIO는 실제 사용자 쿼리의 절반 이상에서 생성되며 논란의 여지가 있는 질문에 자주 나타납니다. 또한, 전통적인 검색 엔진과 달리 AI 개요는 Google 소유 콘텐츠를 더 많이 참조하는 경향이 있으며, 웹사이트 가시성 및 정보 신뢰성에 중요한 함의를 제시합니다.

핵심 포인트

  • AI 개요(AIO)는 실제 사용자 쿼리의 상당 부분에서 생성되며, 논란의 여지가 있는 질문에 자주 나타난다.
  • 생성형 검색 엔진은 전통적인 검색 엔진과 달리 Google 소유 콘텐츠를 참조할 가능성이 현저히 높다.
  • 웹사이트가 AI 크롤러를 차단하면 AIO를 통해 검색될 가능성이 낮아져 웹사이트 가시성에 영향을 미친다.
  • AIO는 쿼리 수정에 덜 견고하고 일관성이 떨어지므로, 정보의 신뢰성을 평가할 때 주의가 필요하다.

사용자에게 제공하는 편의성으로 인해 생성형 AI 가 웹 검색에 점점 더 통합되고 있습니다. 본 연구에서는 전통적인 검색 엔진과 달리 정보를 다르게 검색하고 제시함으로써 생성형 AI 가 웹 검색을 어떻게 교란시키는지 이해하고자 합니다. 우리는 생성형 검색의 향후 연구를 지원하기 위해 11,500 건의 사용자 쿼리를 포함한 공개 벤치마크 데이터셋을 소개합니다. 각 쿼리에 대해 Google 의 검색 엔진, 동반되는 AI 개요 (AI Overview, AIO), 및 Gemini Flash 2.5 가 반환하는 검색 결과를 비교했습니다. 우리는 몇 가지 핵심 발견 사항을 얻었습니다. 첫째, 대표적이고 실제 사용자의 쿼리 중 51.5% 에 대해서는 AIO 가 생성되어 유기적 검색 결과 위에 표시됩니다. 논란의 여지가 있는 질문은 빈번하게 AIO 를 유발합니다. 둘째, 각 검색 엔진에 대해 검색된 소스가 현저히 다르다는 것을 보여줍니다 (평균 Jaccard 유사도 <0.2). 전통적인 Google 검색은 정부 또는 교육 기관의 인기 있거나 기관 웹사이트에서 정보를 검색할 가능성이 현저히 높은 반면, 생성형 검색 엔진은 Google 소유 콘텐츠에서 정보를 검색할 가능성이 현저히 높습니다. 셋째, Google 의 AI 크롤러를 차단하는 웹사이트는 콘텐츠를 접근할 수 있음에도 불구하고 AIO 에 의해 검색될 가능성이 현저히 낮다는 것을 관찰합니다. 마지막으로, 동일한 쿼리의 두 번의 실행을 처리할 때 AIO 가 덜 일관성이 있으며, 작은 쿼리 수정에 덜 견고합니다. 우리의 발견은 생성형 검색이 웹사이트 가시성에 미치는 영향, 생성형 엔진 최적화 기술의 효과성, 그리고 사용자가 받는 정보에 대한 이해를 위한 중요한 함의를 가집니다. 우리는 발행인과 생성형 검색 제공자를 위한 지속 가능하고 상호 이득적인 생태계를 조성하기 위해 수익 프레임워크를 촉구합니다.

AI 자동 생성 콘텐츠

본 콘텐츠는 arXiv cs.CL의 원문을 AI가 자동으로 요약·번역·분석한 것입니다. 원 저작권은 원저작자에게 있으며, 정확한 내용은 반드시 원문을 확인해 주세요.

원문 바로가기
2

댓글

0