본문으로 건너뛰기

© 2026 Molayo

Dev.to헤드라인2026. 06. 01. 09:28

세계 최대 호텔 플랫폼을 감사했습니다. AI 여행 에이전트들이 무엇을 상속받도록 훈련되고 있는지 공개합니다.

요약

Booking.com의 데이터 구조를 분석하여 현재 여행 플랫폼의 스키마가 가진 한계를 지적합니다. 기존 플랫폼이 제공하지 못하는 다양한 사용자 요구사항을 AI 에이전트가 비구조화된 데이터를 통해 어떻게 해결할 수 있는지 탐구합니다.

핵심 포인트

  • 기존 여행 플랫폼의 데이터 스키마는 특정 인구 집단의 요구를 반영하지 못함
  • 통화 및 필터링 옵션의 부재로 인한 사용자 경험의 공백 존재
  • AI 에이전트는 비구조화된 신호를 통해 누락된 데이터를 추론할 수 있음
  • 풍부한 구조화된 데이터 확보가 차세대 여행 서비스의 핵심

저는 기존 업계가 설계한 일반적인 여행객과는 다른 방식으로 이동하는 사람들을 위한 여행 앱인 Sola를 운영하고 있습니다. 앱을 개발하면서 저는 계속해서 동일한 벽에 부딪혔습니다. 제가 쿼리(Query)하고 싶었던 데이터가 존재하지 않았던 것입니다. 아무도 데이터를 수집하지 않아서가 아니라, 업계 전체를 관통하는 스키마 (Schema)에 해당 필드가 아예 없었기 때문입니다.

그래서 2026년 5월 27일, 저는 자리에 앉아 Booking.com을 감사(Audit)했습니다. 홈페이지 양식, 통화 선택기, 방콕 검색 결과 페이지 등을 살펴보았습니다. 저는 해당 플랫폼이 무엇을 수용하고 무엇을 거부하는지를 기록했습니다. 그런 다음, 그 플랫폼 위에서 출시되고 있는 새로운 AI 여행 에이전트들을 살펴보았습니다.

제가 발견한 내용과 이것이 현재 이 분야에서 활동하는 모든 이들에게 왜 중요한지를 알려드리겠습니다.

양식(Form)이 곧 명세(Spec)다

Booking.com의 홈페이지 검색창은 정확히 네 가지 입력값만을 수용합니다:

  • 단일 텍스트 필드 형태의 목적지
  • 하나의 범위로 지정된 체크인 날짜 및 체크아웃 날짜

드롭다운 상단에는 8개의 통화가 주요하게 표시됩니다. 제가 테스트를 실행한 날의 순서는 EUR, USD, GBP, AED, SGD, AUD, JPY, PHP였습니다. 여덟 번째 슬롯은 지리적으로 개인화(geo-personalised)되어 있으며, 테스트 IP가 필리핀으로 확인됨에 따라 PHP가 상위로 올라왔습니다. 나머지 44개 통화는 알파벳 순서에 따라 그 아래에 위치합니다: BRL은 12번째, EGP는 19번째, INR은 25번째, IDR은 26번째, MXN은 33번째, ZAR은 45번째, KRW은 46번째, THB는 49번째입니다.

이제 누락된 부분입니다. 다음 5개 경제권의 통화는 드롭다운에 전혀 포함되어 있지 않습니다:

  • 나이지리아 나이라 (2억 2,000만 명)
  • 방글라데시 타카 (1억 7,000만 명)
  • 베트남 동 (1억 명)
  • 케냐 실링 (5,500만 명)
  • 가나 세디 (3,300만 명)

이 5개국에서만 약 5억 8,000만 명에 달합니다. 아프리카와 동남아시아 전역의 확인되지 않은 공백까지 더하면, 자신의 통화로 호텔 가격을 볼 수 없는 인구는 6억 명을 넘어섭니다. 이들은 검색할 때마다 머릿속으로 환율을 계산해야 하며, 플랫폼이 묻지도 않은 통화로 결제하기 위해 은행에 수수료를 지불합니다.

필터: 22개 그룹에 걸친 115개 항목, 그리고 그 공백이 핵심입니다.

방콕을 검색하면 필터의 벽을 마주하게 됩니다. 1박당 가격, 숙소 유형 (호텔, 호스텔, 료칸, 캡슐, 빌라, 모텔, 보트 등), 침실 수, 욕실 수, 리뷰 점수, 무료 취소, 조식, 수영장, 주차, 와이파이, 공항 셔틀, 성급 (star rating), 지역, 중심지에서의 거리, 호텔 체인, 침대 선호도, 사우나, 마사지, 해피아워, 반려동물 동반 가능, 성인 전용 등으로 범위를 좁힐 수 있습니다.

하지만 다음과 같은 항목으로는 필터링할 수 없습니다:

  • 비자 요구 사항
  • 할랄 (Halal) 음식 또는 호텔 인증
  • 코셔 (Kosher), 자인 (Jain), 채식주의 식단 요구 사항
  • 기도실 또는 키블 (qibla) 방향
  • 지역 사회 소유 또는 현지인 소유 숙소
  • 여성 전용 층 또는 야간 여성 안전 보장
  • 모스크, 사원, 회당(synagogue) 또는 교회까지 도보 거리
  • 운전을 하지 않는 여행객을 위한 대중교통 접근성
  • 6인 이상의 가족 그룹

"visa(비자)", "halal(할랄)", "kosher(코셔)"

실질적인 탈출구는 단 두 가지뿐입니다. 호텔이 더 풍부한 구조화된 데이터 (structured data)를 게시하는 것인데, 이는 국가적 명령이나 플랫폼의 영향력이 필요합니다. 또는 플랫폼이 리뷰, 사진, 웹 언급, 제3자 데이터셋과 같은 비구조화된 신호 (unstructured signals)로부터 누락된 차원을 추론하는 것입니다. Booking.com은 두 번째 방식을 구축할 수 있습니다. 하지만 그들은 그렇게 하지 않았습니다.

에이전트가 상속받는 것

2025년 10월 6일, OpenAI는 DevDay에서 제3자 서비스가 ChatGPT 내부에서 실행될 수 있도록 하는 Apps SDK를 발표했습니다. Booking.com은 출시 파트너였습니다. 이제 채팅창을 통해 접근 가능한 동일한 네 가지 필드(fields)가 제공됩니다.

에이전트 계층 (agent layer)은 다음 단계의 깔때기 상단(top of the funnel)이며, 여기에 함정이 있습니다. 훈련 데이터 (training data)는 이전 계층의 산물입니다. 대규모 언어 모델 (LLM)이 여행 정보를 위해 읽는 웹은 Booking, Expedia, Airbnb, TripAdvisor, Google Travel의 코퍼스 (corpus)이며, 이는 영어로 되어 있고 해당 플랫폼들의 기본 설정 (defaults)이 내재되어 있습니다. 해당 데이터셋으로 에이전트를 출시한다면, 당신은 데이터셋의 기본 설정을 출시하는 것입니다. 스키마 (schema)는 훈련 데이터를 통해 스스로를 복제합니다.

저는 이것이 축소판으로 일어나는 것을 목격했습니다. Booking은 자연어(

  • 입력을 기능 목록이 아닌 스키마 (schema)로서 감사하십시오. 무엇이 결여되어 있는지가 그 제품이 누구를 위해 구축되었는지를 인코딩(encode)합니다. 제공되는 것이 아니라, 무엇이 빠져 있는지를 세어보십시오.
  • 훈련 코퍼스 (training corpus)가 당신의 기본값 (defaults)을 대신 결정하게 두지 마십시오. 상속된 데이터는 상속된 가정을 실어 나릅니다. 기본 정렬 방식, 통화 목록, 투숙 인원 카운터: 누군가가 그것들을 선택했으며, 당신이 개입하지 않는 한 그 선택은 이제 당신의 가중치 (weights) 안에 들어 있습니다.
  • 구조적 기회는 추론 (inference)에 있습니다. 온라인 여행사 (OTA)들이 6억 명의 사람들에게 서비스를 제공할 수 없는 전체적인 이유는 데이터 모델 (data model)에 그들을 위한 필드 (field)가 없기 때문입니다. 에이전트 (agents)는 OTA가 버린 신호들로부터 그 필드를 구축할 수 있습니다. 그것이 바로 실제 제품입니다.

Booking.com이 구축된 대상이었던 여행객들은 지난 30년 동안 서비스를 받아왔습니다. 다음의 기본값은 지금 이 순간, 훈련 실행 (training runs)과 시스템 프롬프트 (system prompts) 속에서 설계되고 있습니다. 그 네 가지 필드는 결코 중립적이지 않았습니다. 당신이 그 위에 구축하는 무엇도 마찬가지입니다.

방법론: 본 조사 결과는 2026년 5월 27일 Booking.com의 홈페이지 양식, 통화 선택기, 방콕 검색 결과 페이지를 직접 살펴보는 과정을 통해 도출되었습니다. 수치와 레이블 문구는 해당 날짜에 렌더링된 플랫폼의 상태를 직접 가져왔습니다. 플랫폼은 반복적으로 업데이트되므로 특정 위치는 변경되었을 수 있습니다. 구조적 논거는 단 하나의 수치에 의존하지 않습니다. 이에 대해 더 자세한 내용은 제 프로필 링크에서 확인하실 수 있으며, 저는 스키마에 결여된 필드를 구축하려는 시도인 Sola를 운영하고 있습니다.

AI 자동 생성 콘텐츠

본 콘텐츠는 Dev.to AI tag의 원문을 AI가 자동으로 요약·번역·분석한 것입니다. 원 저작권은 원저작자에게 있으며, 정확한 내용은 반드시 원문을 확인해 주세요.

원문 바로가기
0

댓글

0