생성형 엔진 최적화(GEO): SEO 키워드를 넘어
요약
전통적인 SEO를 넘어 LLM이 정보를 효과적으로 소비할 수 있도록 하는 생성형 엔진 최적화(GEO) 전략을 다룹니다. 구조화된 사실, 검증 가능한 저자성, 지속 가능한 페이지 구축을 통해 Perplexity와 같은 AI 답변 엔진에서 인용될 확률을 높이는 방법을 설명합니다.
핵심 포인트
- 키워드 중심에서 구조화된 사실(Structured Facts) 중심으로 전환 필요
- LLM 파싱을 위한 스키마(Schema) 활용 및 명확한 저자 신호 제공
- 인용 가능성을 높이는 영구적 URL과 고품질 도메인 유지
- 검색 엔진 색인보다 LLM의 정보 소비 방식에 맞춘 콘텐츠 설계
원래 AIdeazz에 게시되었으며, 여기에는 정식 링크가 함께 게재되었습니다.
제 AI 에이전트들이 6개월 동안 Perplexity 답변에 나타나지 않았습니다. 저는 전통적인 SEO(검색 엔진 최적화): 키워드, 백링크, 콘텐츠 길이 등에 맞춰 최적화를 진행했습니다. 그것은 120시간의 낭비였습니다. 문제는 제 콘텐츠가 아니라 제 콘텐츠의 _형식_이었습니다. 생성형 엔진 최적화 (Generative Engine Optimization, GEO)는 키워드가 아닙니다. 구조화된 사실(structured facts), 검증 가능한 저자성(verifiable authorship), 그리고 인용 가능한 지속적인 페이지에 관한 것입니다. 저는 검색 엔진뿐만 아니라 LLM들에게도 정보를 공급해야 했습니다.
저는 Oracle Cloud에서 운영되는 AIdeazz를 VC 자금 없이 운영하고 있습니다. 제 다중 에이전트 시스템은 속도를 위해 Groq, 복잡한 추론을 위해 Claude, 그리고 사용자 지정 라우팅(custom routing)을 사용합니다. 제 에이전트들은 Telegram과 WhatsApp을 통해 사용자에게 서비스를 제공합니다. 모든 달러가 중요합니다. 모든 분이 중요합니다. 제 콘텐츠가 인용되지 않는다는 것은 제 에이전트들이 발견되지 않고 있다는 의미였고, 제 비즈니스가 성장하지 못하고 있다는 의미였습니다. 저는 콘텐츠 전략을 완전히 수정하여 검색 엔진이 _색인화(index)_하는 것보다 LLM이 _소비(consume)_하는 것에 초점을 맞췄습니다.
키워드에서 구조화된 사실로의 전환
저의 초기 콘텐츠 전략은 재앙적이었습니다. 저는
이것은 단순한 메타데이터가 아닙니다. 이는 LLM (Large Language Model)에 대한 직접적인 지침입니다: "여기 사실이 있고, 여기 그 출처가 있으며, 여기 저자가 있습니다." 저는 Google이 이를 직접 표시하기를 기대하는 것이 아니라, LLM이 이를 파싱 (parse)하기를 기대합니다. 이를 구현한 지 두 달 만에, 제 콘텐츠는 Perplexity 답변에서 직접적인 인용 (citation)으로 나타나기 시작했습니다. 특히 기술 비교 및 가격 데이터 분야에서 그러했습니다.
저자 신호 (Authorship Signals)와 지속 가능한 페이지 (Durable Pages)
LLM은 저자 (authorship)와 권위 (authority)에 점점 더 민감해지고 있습니다. 익명의 블로그 게시물은 알려진 전문가의 것으로 귀속된 게시물보다 인용될 가능성이 낮습니다. 저는 AIdeazz.xyz의 모든 콘텐츠에 명확한 저자가 있도록 했으며, 저자의 전문적인 배경, 포트폴리오 및 소셜 프로필이 포함된 전용 저자 페이지와 연결했습니다.
제 저자 페이지(https://aideazz.xyz/elena-revicheva)에는 다음이 포함되어 있습니다:
name,url,sameAs(LinkedIn, GitHub),alumniOf(출신 대학)를 포함한@type: Person스키마 (schema).- 제 경력을 상세히 기술한 간결한 바이오 (bio) (예: "엔터프라이즈 소프트웨어 분야 15년 경력, Oracle Cloud에서 3개의 프로덕션 AI 에이전트 구축 및 출시").
- 각각 고유한 구조화된 데이터 (structured data)를 가진 포트폴리오 프로젝트 링크.
"지속 가능한 페이지 (durable page)" 개념은 매우 중요합니다. LLM은 안정적이고 권위 있는 출처를 인용하는 것을 선호합니다. 이는 다음을 의미합니다:
- 영구적 URL (Permanent URLs): 슬러그 (slug)를 변경하지 않습니다. URL이 한 번 게시되면 고정됩니다.
- 고품질 도메인 (High-quality domain): 제 콘텐츠는 Medium 포스트나 Substack이 아닌, 제가 제어하는 도메인인
aideazz.xyz에 존재합니다. 이는 소유권과 안정성을 나타냅니다. - 정기적인 업데이트 (Regular updates): 새로운 기사를 만드는 대신, 기존 기사에 새로운 정보를 추가하여 업데이트하고 스키마에
dateModified를 표시합니다. 이는 콘텐츠가 유지 관리되고 최신 상태임을 보여줍니다.
저는 이러한 저자 신호와 지속성 신호를 구현한 후, Perplexity가 특히 제 페이지를 더 빈번하게 인용하기 시작하는 것을 관찰했습니다. 이는 단순히 콘텐츠에 관한 것이 아니라, 콘텐츠와 관련된 신뢰 신호 (trust signals)에 관한 것입니다.
인용 준비가 된 형식: "답변 블록 (Answer Block)"
LLM은 기사 전체를 요약하고 싶어 하지 않습니다. 대신 인용할 수 있는 직접적인 답변을 원합니다. 저는 각 섹션의 시작 부분에 "답변 블록 (answer block)"을 두어 기사를 구조화하기 시작했습니다. 이는 잠재적인 질문에 직접적으로 답하는 2~4문장 정도의 요약입니다.
예를 들어, "Oracle Cloud GPU의 비용 효율성"에 관한 섹션의 경우, 답변 블록은 다음과 같을 수 있습니다:
"Oracle Cloud Infrastructure는 NVIDIA A100 GPU에 대해 매력적인 비용 이점을 제공합니다. 인스턴스 가격은 시간당 $X.XX로, AWS나 Azure의 유사한 서비스보다 종종 15-25% 더 저렴하여 예산이 제한된 AI 학습 워크로드에 이상적입니다."
이 블록 뒤에는 상세한 설명, 벤치마크(benchmarks) 및 데이터가 뒤따릅니다. 이를 통해 LLM은 섹션 전체를 처리할 필요 없이 핵심 포인트를 빠르게 추출할 수 있습니다. 또한 저는 이러한 답변 블록이 <p> 태그로 감싸져 있고, 복잡한 문장 구조나 전문 용어를 피해 쉽게 파싱(parsing)될 수 있도록 합니다.
이러한 접근 방식은 제 콘텐츠가 LLM 응답에서 직접 인용되거나 의역될 가능성을 크게 높였으며, 종종 제 페이지로 연결되는 직접적인 링크도 함께 제공되었습니다. 이는 생성형 엔진(generative engine)을 위해 정보를 미리 소화(pre-digesting)해 두는 작업입니다.
GEO를 위한 Oracle Cloud Infrastructure의 이점
제 AI 에이전트들을 Oracle Cloud Infrastructure (OCI)에서 실행하는 것은 단순한 비용 절감을 넘어선 전략적 결정이었습니다. OCI의 예측 가능한 성능과 전용 리소스(dedicated resources)는 저의 GEO 활동을 위한 더 빠른 콘텐츠 생성 및 처리로 직결됩니다.
저의 콘텐츠 생성 파이프라인 (content generation pipeline):
- 데이터 수집 (Data Ingestion): OCI 컴퓨팅 인스턴스에서 실행되는 커스텀 Python 스크립트가 공개 데이터(예: 경쟁사 가격, 벤치마크 결과)를 스크래핑합니다.
- 사실 추출 (Fact Extraction): Groq 기반의 에이전트(OCI VM에서 실행되며 API를 통해 접속)가 원문 텍스트에서 구조화된 사실을 추출하여 예비 JSON-LD를 생성합니다. 이 에이전트는 100만 토큰당 $0.00027의 비용으로 초당 1,000 토큰을 처리합니다.
- 정제 및 검증 (Refinement & Verification): Claude 3 Opus 에이전트(복잡한 추론용, 역시 API를 통해 접속)가 추출된 사실의 정확성과 완전성을 검토하여 JSON-LD 스키마가 올바르고 검증 가능한지 확인합니다. 이 에이전트의 비용은 입력 토큰 100만 개당 $15입니다.
- 콘텐츠 생성 (Content Generation): 구조화된 사실을 전달받은 또 다른 Groq 에이전트가 인용 준비가 된(citation-ready) 형식을 준수하며 "답변 블록(answer blocks)"과 보조 텍스트를 생성합니다.
- 배포 (Deployment): 최종 HTML과 JSON-LD는 OCI Object Storage 버킷에 배포되며, 전 세계적인 가용성과 속도를 위해 OCI Load Balancer 및 CDN을 통해 서비스됩니다. 이 설정의 비용은 스토리지에 월 $15, 로드 밸런서에 월 $20가 소요됩니다.
이 전체 파이프라인은 OCI에서 실행되므로 인프라, 보안 및 비용에 대해 완전한 제어권을 가집니다. 저는 지연 시간(latency)이나 예측 불가능한 비용을 초래할 수 있는 제3자 호스팅에 의존하지 않습니다. 이러한 안정성은 GEO의 "지속 가능한 페이지(durable page)" 측면을 유지하는 데 매우 중요합니다.
성공 측정: Google Analytics를 넘어
전통적인 SEO 지표(페이지 뷰, 이탈률)는 여전히 유효하지만, GEO를 위해 저는 다른 신호들을 추적합니다:
- 직접 인용 (Direct citations): 저는 커스텀 스크립트를 사용하여 Perplexity, ChatGPT, Gemini에서
aideazz.xyz또는 특정 기사 제목이 언급되는지 모니터링합니다. 현재는 수동 프로세스이지만, 이를 자동화하기 위한 에이전트(agent)를 구축하고 있습니다. - 구조화된 데이터 검증 (Structured data validation): 정확성을 보장하기 위해 정기적으로 JSON-LD를 Google의 리치 결과 테스트(Rich Results Test) 및 Schema.org 검증기를 통해 실행합니다. 여기서 오류가 발생하면 LLM이 제 데이터를 무시할 수 있습니다.
- 내 콘텐츠에 대한 API 호출 볼륨: LLM API 로그에 직접 접근할 수는 없지만, 생성형 엔진(generative engines)에 의한 프로그래밍 방식의 스크래핑(programmatic scraping)을 나타낼 수 있는 비정상적인 액세스 패턴을 확인하기 위해 CDN 로그를 모니터링합니다.
- 생성형 엔진으로부터의 직접 트래픽: 일부 LLM은 직접적인 링크를 제공합니다. 저는 이러한 리퍼러(referrers)를 추적합니다.
저의 목표는 단순한 트래픽이 아니라 _영향력(influence)_입니다. 저는 저의 사실(facts)이 생성형 AI의 진실의 근원(source of truth)이 되기를 원합니다. 이를 위해서는 콘텐츠가 생성되고 구조화되는 방식에 근본적인 변화가 필요합니다.
자주 묻는 질문 (Frequently Asked Questions)
Q: GEO는 단순히 고급 SEO의 또 다른 이름인가요?
A: 아닙니다. SEO는 키워드와 링크를 우선시하는 검색 엔진 알고리즘에 최적화합니다. 반면 GEO는 LLM의 소비에 최적화하며, 구조화된 사실(structured facts), 검증 가능한 저자(verifiable authorship), 그리고 종종 JSON-LD와 직접 답변 블록(direct answer blocks)을 사용하는 인용 준비가 된 형식(citation-ready formats)에 집중합니다.
Q: LLM이 실제로 제 구조화된 데이터를 사용하고 있는지 어떻게 알 수 있나요?
A: 생성형 AI 출력물(Perplexity, ChatGPT, Gemini)에서 귀하의 도메인이나 특정 콘텐츠가 직접 인용되는지 모니터링하십시오. 스키마 검증기를 통해 JSON-LD를 엄격하게 검증하십시오. 또한 이러한 플랫폼으로부터의 직접적인 리퍼럴 트래픽(direct referral traffic)이 증가하는지 확인하십시오.
Q: GEO를 위해 가장 중요한 구조화된 데이터 요소는 무엇인가요?
A: 명확한 citation(인용) 및 author(저자) 속성과 결합된 Claim(주장) 또는 Fact(사실) 스키마입니다. 이는 LLM에게 핵심적인 단언(assertion)이 무엇인지, 그것이 어디에서 왔는지, 그리고 누가 만들었는지를 직접적으로 알려줍니다.
Q: GEO를 위해 헤드리스 CMS (Headless CMS)를 사용할 수 있나요, 아니면 커스텀 코드가 필요한가요?
A: 헤드리스 CMS (Headless CMS)는 구조화된 사실 (structured facts)을 저장할 수 있지만, 페이지에 JSON-LD를 올바르게 렌더링하고 "답변 블록 (answer block)" 형식을 일관되게 구현하려면 커스텀 코드가 필요할 가능성이 높습니다. 제 설정은 커스텀 Python 파이프라인 (Python pipeline)을 사용합니다.
Q: GEO를 구현할 때 발생하는 비용 측면의 영향은 무엇인가요?
A: 주요 비용은 콘텐츠를 구조화하고 스키마 (schema)를 구현하는 데 드는 개발 시간입니다. 구조화된 데이터를 제공하기 위한 인프라 비용은 매우 미미하며, 특히 정적 콘텐츠 전송 (static content delivery) 비용이 저렴한 OCI와 같은 클라우드 플랫폼에서는 더욱 그렇습니다. 저의 OCI 콘텐츠 전송 비용은 월 40달러 미만입니다.
AI 자동 생성 콘텐츠
본 콘텐츠는 Dev.to AI tag의 원문을 AI가 자동으로 요약·번역·분석한 것입니다. 원 저작권은 원저작자에게 있으며, 정확한 내용은 반드시 원문을 확인해 주세요.
원문 바로가기