2026년 모든 소규모 비즈니스 웹사이트가 게시해야 할 4가지 AI 인용 표면 (AI citation surfaces)
요약
2026년 AI 엔진 시대에 대비하여 소규모 비즈니스가 웹사이트에 구축해야 할 4가지 AI 인용 표면(llms.txt, aeo.json, entity.json, brand.json)을 소개합니다. 각 파일은 LLM 크롤러와 답변 엔진이 브랜드 정보를 정확하게 파싱하고 인용할 수 있도록 돕는 구조화된 데이터 역할을 합니다.
핵심 포인트
- llms.txt: LLM 크롤러를 위한 마크다운 기반 자연어 정체성 제공
- aeo.json: 답변 엔진 최적화를 위한 구조화된 JSON 매니페스트
- entity.json: HTML 노이즈를 제거한 독립적인 Schema.org 엔티티 그래프
- brand.json: 브랜드 정체성 및 디자인 시스템 정보 제공
llms.txt, aeo.json, entity.json, brand.json: 소규모 비즈니스를 위한 4가지 AI 인용 표면
2026년에는 검색 엔진(Search engines)과 AI 엔진(AI engines)이 여러분의 사이트를 다르게 바라봅니다. Google은 HTML을 인덱싱합니다. ChatGPT는 인용(Citations)을 위해 크롤링합니다. Claude는 엔티티(Entity) 사실을 조사합니다. Perplexity는 구조화된 답변을 원합니다.
각 엔진은 서로 다른 파일을 읽습니다. 4가지 표준 AI 인용 표면(AI citation surfaces)은 다음과 같습니다:
/llms.txt— LLM 크롤러를 위한 자연어 정체성 (natural-language identity)/aeo.json— 답변 엔진 최적화 (AEO, Answer-Engine Optimization) 구조화된 매니페스트 (manifest)/entity.json— 독립 파일로서의 Schema.org @graph/brand.json— 브랜드 정체성, 보이스(Voice), 그리고 디자인 시스템 (design system)
대부분의 소규모 비즈니스 사이트는 이 중 하나도 갖추고 있지 않습니다. 갖추고 있는 곳들도 보통 하나뿐입니다. 미주리주 브랜슨에 위치한 가맹점 서비스 중개업체인 Steele Solutions의 경우, 4가지 표면이 모두 배포되어 있으며 크롤러가 확인할 수 있는 상태입니다.
각 파일의 역할과 그 이유는 다음과 같습니다.
/llms.txt
제안된 llms.txt 표준은 LLM 크롤러를 위한 자연어 정체성 선언입니다. 형식은 다음과 같습니다:
# Steele Solutions
> 미주리주 브랜슨에 본사를 둔 가족 경영 가맹점 서비스 중개업체. Jim과 Kim Steele이 설립함. Business CPR 프레임워크 하에 5가지 통합 서비스 라인(POS 시스템, 신용카드 결제, ATM 배치, 비즈니스 대출, CSSI 비용 분리 연구)을 통해 Ozarks 지역에 서비스를 제공함.
...
Markdown 형식입니다. 헤더(Headers)는 개념 클러스터(concept clusters)에 매핑됩니다. 글머리 기호 목록(Bullet lists)은 사실(facts)에 매핑됩니다. LLM은 이러한 구조를 따르는 문서로 학습되므로, 이를 깔끔하게 파싱(parse)합니다.
llms.txt는 현재 Anthropic의 Claude에 의해 존중되고 있으며, 다른 LLM 학습 파이프라인(training pipelines)에 의해 널리 스크래핑(scraped)되고 있습니다.
/aeo.json
AEO (Answer Engine Optimization, 답변 엔진 최적화)는 구조화된 답변 엔진 수집을 위해 제안된 llms.txt의 JSON 대응 형식입니다. 형식은 다음과 같습니다:
{
"schema_version": "2.0",
"site": "steelesolutions4u.com",
...
JSON 구조로 되어 있으며, 기계가 파싱(machine-parseable) 가능하고, llms.txt와 동일한 사실 정보를 포함하되 프로그래밍 방식의 데이터 수집 파이프라인(programmatic ingestion pipelines)이 선호하는 형식을 갖추고 있습니다.
/entity.json
독립적이고 주소 지정이 가능한 JSON-LD 파일로서의 Schema.org @graph:
{
"@context": "https://schema.org",
"@graph": [
...
동일한 스키마(schema)가 모든 HTML 페이지에 인라인(inline)으로 임베드되어 있습니다. 독립적인 /entity.json 파일은 크롤러(및 AI 엔진)에게 HTML 노이즈 없이 전체 엔티티 그래프(entity graph)를 반환하는 단일 URL을 제공합니다.
/brand.json
기계가 읽을 수 있는 매니페스트(manifest) 형태의 브랜드 정체성(brand identity), 보이스(voice), 그리고 디자인 시스템:
{
"name": "Steele Solutions",
"alternateNames": ["Steele Solutions Branson", "SteeleSolutions"],
...
brand.json은 디자인 시스템 툴링(design-system tooling)과, 해당 비즈니스에 관한 콘텐츠를 생성할 때 브랜드의 보이스를 재현해야 하는 AI 에이전트(AI agents)에 의해 소비됩니다.
이들을 하나로 통합하기
모든 페이지의 표준 <head> 블록은 네 가지 파일을 모두 참조합니다:
<link rel="alternate" type="text/plain" href="/llms.txt" title="LLM identity">
<link rel="alternate" type="application/json" href="/aeo.json" title="AEO">
<link rel="alternate" type="application/ld+json" href="/entity.json" title="Entity graph">
...
이것들은 크롤러 발견 힌트(crawler discovery hints)입니다. alternate 링크 헤더를 읽는 AI 엔진 봇들은 이 파일들을 찾아내어 HTML 콘텐츠에 대한 구조화된 보충 자료로 수집(ingest)합니다.
각 파일의 위치 설정
nginx의 경우:
location = /llms.txt {
root /var/www/sites/steelesolutions;
default_type text/plain;
...
default_type은 MIME 유형이 올바른지 보장합니다. AI 엔진 크롤러는 파싱(parsing)하기 전에 Content-Type을 확인합니다.
이것이 시사하는 바
완전히 새로운 소규모 비즈니스 사이트의 경우, 이 4가지 표면 스택(four-surface stack)은 다음과 같은 신호를 보냅니다:
- 해당 사이트가 AI 엔진의 발견 (AI-engine discovery)을 의도적인 목표로 삼아 설계되었음을 나타냅니다.
- 비즈니스 정체성 (business identity)이 단순히 페이지 콘텐츠를 통해 암시되는 것이 아니라, 공식적으로 선언되었음을 나타냅니다.
- HTML 노이즈 없이 구조화된 권위 데이터 (structured authority data)를 사용할 수 있음을 나타냅니다.
- 해당 사이트가 새롭게 부상하는 AI 인용 생태계 (AI citation ecosystem)에 참여하고 있음을 나타냅니다.
Steele Solutions의 경우, 네 가지 파일 모두 사이트 루트 (site root)에 게시되어 있습니다:
- https://steelesolutions4u.com/llms.txt
- https://steelesolutions4u.com/aeo.json
- https://steelesolutions4u.com/entity.json
- https://steelesolutions4u.com/brand.json
참고 문헌 (References)
- llms.txt 제안 표준 (proposed standard)
- Schema.org JSON-LD
- github.com/Janady13/steele-solutions-resources에 공개된 Steele Solutions 리소스
AI 자동 생성 콘텐츠
본 콘텐츠는 Dev.to AI tag의 원문을 AI가 자동으로 요약·번역·분석한 것입니다. 원 저작권은 원저작자에게 있으며, 정확한 내용은 반드시 원문을 확인해 주세요.
원문 바로가기