AI의 거짓말을 간파할 수 있을까? Gemini의 검색 및 이미지 그라운딩(Grounding)을 실제로 테스트하며 알게 된 것

요약

Gemini의 검색 및 이미지 그라운딩(Grounding) 기능을 실제 테스트하여 그 효용성을 분석합니다. 그라운딩이 답변의 절대적 정확성을 보장하지는 않지만, 출처와 검색 키워드를 제공함으로써 사용자가 답변의 사실 여부를 검증할 수 있게 돕는다는 점을 강조합니다.

핵심 포인트

그라운딩은 답변의 정확성을 보장하는 마법이 아닌 검증 가능성을 높이는 도구임
검색 키워드와 출처를 함께 제공하여 사용자가 직접 사실 관계를 확인할 수 있게 함
최신 업데이트를 통해 답변과 관련된 실재하는 이미지 검색 결과도 제공 가능
검색 결과 채택 방식에 따라 답변의 일관성이 흔들릴 수 있음을 유의해야 함

안녕하세요!

KDDI Ilet의 활동으로서 6월 22일~7월 3일 기간 동안 개최 중인 「Google Cloud Next '26 / Google I/O 해본 이야기 블로그 릴레이」, 오늘은 4일 차 포스팅입니다.

이번에는 「Gemini의 검색 및 이미지 그라운딩 (Grounding)」 을 대상으로, 실제로 검증해 본 모습을 전달해 드립니다!

생성형 AI (Generative AI) 에 무언가를 질문하면, 그럴듯한 답변이 즉시 돌아옵니다.

하지만 곤란한 점은, 학습한 시점의 오래된 정보를 마치 최신 정보인 것처럼 대답해 버리는 경우가 있다는 점입니다. 게다가 「어디에 적혀 있었는지」에 대한 출처가 없기 때문에, 맞는지 틀린지 스스로 확인할 수 없습니다.

이 약점에 효과적이라고 알려진 것이 바로 그라운딩 (Grounding) 입니다. AI가 대답하기 전에 Google 검색으로 사실 관계를 확인하고, 출처를 세트로 반환하는 메커니즘이며, 최근 업데이트를 통해 답변에 관련된 실재하는 이미지까지 덧붙일 수 있게 되었습니다.

이번에는 「그라운딩 없음/있음」에 따라 AI의 답변이 어떻게 변하는지 실제로 테스트하여, 이 기능의 진정한 활용처를 확인해 보겠습니다.

결론부터 말씀드리면, 그라운딩은 「답변을 반드시 정확하게 만들어 주는 마법」은 아닙니다. 하지만 다른 곳에서 확실한 가치가 있었습니다.

이미지는, 「AI에게 대답하기 전에 Google 검색으로 '리서치'를 시키는 메커니즘」 입니다.

AI가 질문을 받음
AI가 스스로 검색 키워드를 생각하여 Google에서 조사함
조사한 내용을 바탕으로 답변함
「어느 사이트를 참고했는지 (출처)」도 함께 반환

사람이 「공식 사이트에 이렇게 적혀 있었습니다」라고 말해주면 안심이 되죠.

그것을 AI가 해준다고 생각하시면 됩니다.

주제로는 요금이 개정될 수 있는 시설의 입장료를 선택했습니다. 「최신 요금은?」이라고 질문하고, 그라운딩 없음과 있음의 답변을 비교합니다.

그라운딩 없음: 금액을 대답해 주기는 하지만, 「○년 ○월 시점의 정보에 기반합니다」라며 스스로 오래되었을 가능성을 고백했습니다. 이것이 맞는지 확인할 방법이 없습니다.

그라운딩 있음: 검색으로 사실 관계를 확인한 후 금액을 대답하며, 「어떤 키워드로 검색했고, 어느 사이트를 참고했는지」도 세트로 반환했습니다.

언뜻 보기에는 그라운딩이 있는 쪽이 더 믿음직스러워 보입니다.

그런데, 돌아온 출처를 따라 확인해 보니 해당 시설은 최근에 요금 체계 자체를 변경하여, 그라운딩이 있는 답변도 사실 최신 정보가 아니었습니다.

게다가 동일한 질문을 몇 번 다시 던지면, 돌아오는 금액은 실행할 때마다 조금씩 흔들렸습니다.

여기서 알 수 있었던 것은, 「그라운딩을 적용한다고 해서 반드시 최신·정확해지는 것은 아니다」 라는 점입니다. 검색 결과 중 무엇을 채택할지, 언제의 정보가 히트할지에 따라 답변은 흔들립니다.

그렇다면 의미가 없느냐 하면, 반대입니다. 그라운딩이 있는 답변에는 AI가 어떻게 조사했는지가 따라옵니다.

AI가 스스로 구성한 검색 키워드
참고한 출처 (사이트)
답변의 어느 문장이 어느 출처에 기반하는지에 대한 대응 관계

사실 이번에는 이 출처를 따라갔기 때문에 「그 금액은 이미 오래되었다」는 것을 깨달을 수 있었습니다.

이 지점이 그라운딩의 본질이라고 느낍니다.

AI의 답변을 맹신하는 것이 아니라, 「답변」과 함께 「확인할 수 있는 단서 (출처)」를 얻는 것. 그래서 답변이 오래되었다면 스스로 간파할 수 있습니다.

정확성을 보장하는 기능이라기보다, 검증 가능하게 만드는 기능으로 생각하면 매우 유효하다고 느꼈습니다.

이번 업데이트의 핵심은 관련 이미지입니다.

「어떤 건물의 외관 사진을 이미지 검색으로 찾아서 보여줘」와 같이 요청하면, AI는 실제로 이미지 검색을 수행하여 여러 장의 관련 이미지를 각각의 출처 페이지와 함께 반환했습니다 (매번 그런 것은 아니었으며, 「이미지로 찾아줘」라고 명시적으로 요청했을 때 나타나기 쉬운 동작이었습니다).

텍스트만으로는 전달하기 어려운 「외관」을 출처와 세트로 보여줄 수 있는 것입니다.

이번 검증은 Google Cloud의 Gemini Enterprise Agent Platform (구 명칭: Vertex AI) 상에서 Python을 통해 각 모델을 호출하여 수행하였습니다.

텍스트 답변 + 웹 그라운딩 (Web Grounding): gemini-2.5-flash

Google 검색을 도구 (Tool)로 전달하는 것만으로 그라운딩 (Grounding)이 활성화됩니다.

이미지 포함 (이미지 검색) 그라운딩: 이미지 검색 (image_search)은 gemini-2.5-flash와 같은 일반적인 텍스트 모델에서는 "지원하지 않음"이라고 응답하며, 이미지 대응 모델인 gemini-3.1-flash-image (통칭 Nano Banana 2)에서만 이용할 수 있었습니다. 이미지가 포함된 기능을 테스트하려면 대응하는 모델을 선택해야 합니다.

이번에 그라운딩을 테스트하며 알게 된 점을 정리합니다.

생성 AI (Generative AI)는 학습 시점의 오래된 정보를 출처 없이 자신만만하게 답변할 때가 있다.
그라운딩을 적용하더라도 답변이 반드시 최신이거나 정확해지는 것은 아니다.
그라운딩의 진정한 가치는 **"검색 키워드, 출처, 본문과의 대응 관계가 부여되어 답변을 스스로 검증할 수 있다"**는 점에 있다.
"이미지 포함" 기능에서는 관련된 실제 이미지가 출처와 함께 반환된다.

결론적으로, 그라운딩은 "정확성을 보장하는 마법"이 아니라 "검증 가능하게 만드는 메커니즘"이라고 생각합니다.

최신 정보나 사실 확인이 필요한 상황에서는 출처와 함께 답변하도록 하고, 마지막에는 사람이 확인하는 방식이 현실적이라고 느꼈습니다.

AI 자동 생성 콘텐츠

원문 바로가기

AI의 거짓말을 간파할 수 있을까? Gemini의 검색 및 이미지 그라운딩(Grounding)을 실제로 테스트하며 알게 된 것

요약

핵심 포인트

그라운딩 없음: 금액을 대답해 주기는 하지만, 「○년 ○월 시점의 정보에 기반합니다」라며 스스로 오래되었을 가능성을 고백했습니다. 이것이 맞는지 확인할 방법이 없습니다.

댓글