2026년에 리뷰 스키마 마크업(Review Schema Markup)을 위해 Llama를 사용하는 방법

원문은 https://seointent.com/blog/llama-for-review-schema-markup에서 처음 게시되었습니다.

요약 (TL;DR)

- 리뷰 스키마 마크업(Review schema markup)을 위한 Llama 사용이란, Meta의 오픈 소스 Llama 모델을 사용하여 원시 리뷰 콘텐츠로부터 JSON-LD Review 및 AggregateRating 구조화 데이터(Structured data)를 대규모로 생성하는 것을 의미합니다.

- Llama를 로컬에서 실행하거나 API를 통해 실행할 수 있으며, 이는 대량의 스키마 생성에 있어 가장 저렴한 옵션이 됩니다. 직접 호스팅할 경우 토큰당 비용이 발생하지 않습니다.
...

리뷰 스키마 마크업(Review schema markup)을 위한 Llama 사용은 Meta의 오픈 소스 Llama 언어 모델을 사용하여 기존 리뷰 콘텐츠로부터 유효한 JSON-LD 구조화 데이터(Structured data) — 구체적으로 Review 및 AggregateRating 스키마 유형 — 를 자동으로 생성하는 것을 의미합니다. 이는 수동으로 스키마를 작성하는 대신 모델이 힘든 작업을 대신 수행하도록 하는 더 넓은 범위의 AI 기반 SEO 워크플로우에 부합합니다.

프로그래밍 방식의 SEO(Programmatic SEO) 팀들이 수천 개의 제품 페이지에 걸쳐 리뷰 스키마를 수동으로 유지 관리하는 것이 리치 결과(Rich result) 자격 요건을 조용히 망가뜨리고 있다는 사실을 깨달으면서, 2025년 말 이 주제에 대한 관심이 급증했습니다. Jasper나 Surfer SEO 같은 도구들도 구조화 데이터(Structured data)를 지나가는 식으로 언급하지만, 오픈 소스 모델을 사용하여 리뷰 스키마를 생성하는 구체적이고 반복 가능한 워크플로우를 제공하지는 않습니다. 그것이 바로 공백입니다. 이 기사는 실제 5단계 프로세스, 작동하는 프롬프트(Prompt), 출력 결과가 실제로 어떻게 보이는지에 대한 솔직한 분석, 그리고 GPT-4o 및 Claude와의 직접적인 비교를 제공합니다. 대규모로 구축 중이라면, Llama를 구체적으로 파고들기 전에 더 넓은 맥락을 위해 우리의 프로그래밍 방식의 SEO 가이드부터 시작하십시오.

리뷰 스키마 마크업을 위한 Llama란 무엇인가?

**Llama For Review Schema Markup (리뷰 스키마 마크업을 위한 Llama)**는 Meta의 Llama 모델(일반적으로 Llama 3 8B 또는 70B)에 프롬프트를 입력하여, 가공되지 않은 리뷰 텍스트를 분석하고 웹페이지의 <head> 또는 인라인 스크립트 태그에 바로 삽입할 수 있는 Review 또는 AggregateRating 스키마 유형을 준수하는 유효한 JSON-LD 구조화 데이터(Structured Data)를 반환하도록 하는 관행을 의미합니다. 올바른 스키마는 Google의 별점 리치 결과(Star-rating rich results)로 가는 직접적인 경로이기 때문에 매우 중요합니다.

이 접근 방식은 _리뷰 스키마 마크업을 위한 AI (AI for review schema markup)_와 오픈 소스 모델 배포(Open-source model deployment)의 교차점에 위치합니다. Llama는 로컬 환경이나 저렴한 추론 엔드포인트(Inference endpoints)에서 실행될 수 있기 때문에, 독점 API(Proprietary APIs)의 토큰 비용 부담 없이 수천 개의 페이지로 확장할 수 있습니다. Schema.org 유형 카탈로그에 따르면, Review 유형은 reviewRating, author, itemReviewed와 같은 특정 속성(Properties)을 필요로 합니다. 비정형 텍스트(Unstructured text)로부터 LLM이 이러한 속성들을 정확하게 채우도록 만드는 것이 바로 이 워크플로우가 빛을 발하는 지점입니다.

왜 특히 리뷰 스키마 마크업에 Llama를 사용해야 하는가?

Llama가 이 워크플로우에서 자리를 잡은 이유는 사용자가 직접 호스팅(Self-host)할 수 있는 유일한 주요 LLM이기 때문입니다. 이는 대규모로 스키마를 생성할 때 페이지당 한계 비용(Marginal cost)이 제로임을 의미합니다. 70B 파라미터 버전은 구조화된 출력(Structured output) 작업에 대한 지시 이행(Instruction-following) 능력에서 GPT-3.5와 대등하며, 8B 버전은 단일 소비자용 GPU에서 실행될 수 있을 만큼 충분히 빠릅니다. 매주 수백 개의 제품 페이지를 처리하는 대행사나 사내 팀의 경우, 이러한 비용 차이는 빠르게 누적됩니다.

- 대규모 운영 시 토큰당 비용 제로 — 단일 A10G GPU에서 자체 호스팅되는 Llama는 시간당 약 2,000개의 리뷰 스키마 요청을 처리할 수 있으며, 이는 대량의 파이프라인을 위한 가장 경제적인 llama SEO 도구 옵션이 됩니다. 대행사를 운영 중이라면, 배포 맥락을 확인하기 위해 당사의 대행사용 AI SEO 페이지를 참조하십시오.

- 완전히 제어 가능한 출력 형식 — 폐쇄형 API와 달리, 검증된 자체 스키마 예시를 사용하여 Llama를 미세 조정(Fine-tune)할 수 있습니다. 이는 모델이 귀하의 정확한 JSON 구조를 학습하게 함으로써, 수백 개의 학습 예시를 거친 후에는 누락된 필드를 환각(Hallucinating)하는 현상을 멈추게 된다는 것을 의미합니다.
...

리뷰 스키마 마크업 (Review Schema Markup)을 위해 Llama를 사용하는 방법: 5단계 워크플로우

목표는 CMS, CSV 또는 스크래핑을 통해 얻은 가공되지 않은 리뷰 텍스트를 가져와 5단계를 거쳐 유효하고 삽입 가능한 JSON-LD로 변환하는 것입니다. 리뷰 텍스트 자체, 제품 이름, 그리고 평균 평점 또는 개별 평점 값이 필요합니다. 첫 실행 시 총 설정 시간은 약 20~30분 정도 소요되며, 이후에는 완전히 스크립트로 자동화할 수 있습니다. 3단계는 대부분의 사람들이 어려움을 겪는 구간인데, 검증 (Validation) 단계를 건너뛰고 깨진 스키마를 운영 환경 (Production)에 배포하기 때문입니다.

- 1단계: 리뷰 데이터를 수집하고 정규화 (Normalize) 하세요. 리뷰를 일관된 형식으로 가져와야 하며, 최소한 다음 항목이 필요합니다: 작성자 이름, 평점 (숫자, 1-5), 리뷰 본문 텍스트, 그리고 리뷰 대상 제품/아이템. 간단한 CSV 형식이면 충분합니다. 정규화 단계를 건너뛰지 마세요. Llama는 입력 데이터가 가공되지 않은 HTML 덩어리(HTML soup)일 때보다 깔끔할 때 더 깨끗한 스키마를 반환합니다. 모델을 다루기 전에 `df[['author','rating','body','product']].dropna()`와 같은 pandas 한 줄 코드를 사용하여 데이터셋을 준비하세요.

- 2단계: 리뷰 스키마 마크업 프롬프트 (Prompt)를 작성하세요. 이것이 가장 중요한 단계입니다. 모호한 프롬프트는 모호한 JSON을 생성합니다. 출력 형식을 고정하는 시스템 프롬프트 (System Prompt)를 사용한 다음, 사용자 턴 (User Turn)에 리뷰 데이터를 전달하세요. 바로 복사해서 사용할 수 있는 작동 가능한 프롬프트는 다음과 같습니다:
...

사용자: 다음 내용에 대한 JSON-LD Review 스키마를 생성하세요:
제품: {product_name}
작성자: {author_name}
평점: 5점 만점에 {rating}
리뷰 텍스트: {review_body}

@context, @type, itemReviewed, author, reviewRating (ratingValue 및 bestRating), 그리고 reviewBody를 포함하세요.
결정론적 (Deterministic) 출력을 위해 temperature=0으로 실행하세요. Llama 3 70B는 이 프롬프트 구조를 사용할 경우 첫 번째 통과 시 약 94%의 유효한 JSON을 생성합니다.

3단계: Google의 요구 사항에 따라 출력을 검증하세요. 이 단계를 건너뛰지 마세요. 생성된 각 스키마를 Google의 리치 결과 테스트(Rich Results Test)에 붙여넣거나, Google의 구조화된 데이터 입문 검증 도구를 통해 프로그래밍 방식으로 실행하세요. 일반적인 실패 사례로는 bestRating 누락, 잘못된 @context URL, 그리고 ratingValue가 숫자가 아닌 문자열로 전달되는 경우가 있습니다. 이러한 오류가 페이지에 반영되기 전에 잡아낼 수 있도록 정규 표현식(regex)이나 JSON 스키마 검증기(JSON schema validator)를 작성하세요.
4단계: 스키마를 페이지에 삽입하세요. 대부분의 CMS 플랫폼에서는 <head> 섹션 내의 <script type="application/ld+json"> 태그 안에 JSON-LD를 추가합니다. WordPress를 사용 중이라면, 커스텀 플러그인이나 SEOintent 통합 기능을 통해 이를 자동으로 처리할 수 있습니다. 정적 사이트나 커스텀 파이프라인의 경우, Llama의 출력을 스크립트 태그로 감싸고 HTML 파일에 추가하는 간단한 Python 문자열 템플릿을 사용하면 안정적으로 작동합니다. 이미 다른 스키마 플러그인이 활성화되어 있다면 중복 삽입되지 않도록 주의하세요. 충돌이 발생하면 리치 결과(rich results)가 표시되지 않을 수 있습니다.
...

Using Llama for review schema markup — step-by-step

Photo by Markus Winkler on Pexels

Llama의 출력이 실제로 어떻게 보이는가

실제 제품 리뷰 입력을 사용하여 Llama 3 70B(Ollama를 통해, temperature=0)로 위의 2단계 프롬프트를 실행했을 때 얻을 수 있는 결과입니다. 제품은 스탠딩 데스크이며, 리뷰어는 "Sarah M.", 평점은 4/5, 리뷰 본문은 두 문장으로 된 의견입니다. 이것은 다듬어지지 않은 첫 번째 통과(first-pass) 출력이며, 세련되게 편집된 데모가 아닙니다. 실제 데이터의 경우 숫자 형식 등을 중심으로 한두 개의 작은 수정이 필요할 수 있습니다.

{

"@context": "https://schema.org",

"@type": "Review",

"itemReviewed": {

"@type": "Product",

"name": "FlexPro 72 Standing Desk"

"author": {

"@type": "Person",

"name": "Sarah M."

"reviewRating": {

"@type": "Rating",

"ratingValue": 4,
...

"reviewBody": "정말 튼튼한 책상입니다. 조립에는 약 45분이 소요되었습니다. 모터는 이전 제품보다 더 조용하지만, 케이블 관리 트레이(cable management tray)가 더 깊었으면 좋겠습니다."

}

솔직히 말해서, 이는 첫 시도로 매우 깔끔한 출력입니다. ratingValue가 문자열(string)이 아닌 숫자(number)로 올바르게 타입 지정되었는데, 이는 Llama에서 가장 흔히 발생하는 실패 모드입니다. 누락된 부분은 datePublished인데, Google이 이를 필수 사항으로 요구하지는 않지만 리뷰의 최신성 신호(freshness signals)에 영향을 미치므로 프롬프트에 추가하는 것이 좋습니다. itemReviewed 블록에는 제품 페이지를 가리키는 url 속성을 포함할 수도 있으며, 이는 엔티티(entity) 연결을 강화합니다.

리뷰 스키마 마크업(Review Schema Markup)을 위한 Llama vs 기타 AI 도구

이 작업에서 Llama의 세 가지 주요 대안은 GPT-4o (OpenAI), Claude (Anthropic), 그리고 Gemini 1.5 Pro (Google)입니다. GPT-4o는 가장 적은 프롬프트 엔지니어링(prompt engineering)으로 구조적으로 가장 정확한 JSON-LD를 생성하지만, 대규모 운영 시 비용 부담이 실질적입니다. Claude는 복잡한 포맷팅 지침을 따르는 데 탁월하며 예외 케이스(edge cases)를 잘 처리합니다. Claude의 구조화된 출력(structured output) 모드에 대해서는 Claude API 문서를 확인하세요. Gemini 1.5 Pro는 네이티브 Google 통합 기능을 갖추고 있지만 JSON 출력이 일관되지 않습니다. Llama는 자체 호스팅(self-hosted) 기반의 대량 워크플로우에서 승리하지만, 한 달에 500페이지 미만을 작업한다면 GPT-4o의 정확도 대비 노력 효율(accuracy-to-effort ratio)이 아마 더 나을 것입니다.

  도구 | 최적의 용도 | 약점 | 무료 티어 여부

  **Llama 3 70B** | 자체 호스팅, 대량의 *자동 리뷰 스키마 마크업* 파이프라인 | 일관되게 깔끔한 JSON을 얻기 위해 GPT-4o보다 더 정교한 프롬프트 필요 | 예 — 자체 호스팅 시 완전 무료
...

만약 귀하가 여러 클라이언트를 대상으로 규모 있게 _리뷰 스키마 마크업을 위한 AI 활용_을 수행하는 에이전시라면, 경제성 측면만 보더라도 Llama가 올바른 선택입니다. 만약 일회성 스키마 수정을 수행하는 개인 운영자라면, 설정 오버헤드(setup overhead)를 감수하지 마세요. 그냥 GPT-4o를 사용하거나 저희의 무료 스키마 마크업 생성기를 직접 사용하십시오.

전문가 팁: 리뷰 스키마 마크업 (Review Schema Markup)의 AI 정확도를 최상으로 유지하려면, 단일 모델을 선택하지 마십시오. Llama를 사용하여 한계 비용(marginal cost) 제로로 초안을 생성한 다음, 유효성 검사(validation)에 실패한 출력값만 GPT-4o를 통해 수정하십시오. 이렇게 하면 전체 데이터셋에 대해 GPT-4o에 근접한 정확도를 유지하면서도 API 비용을 80% 절감할 수 있습니다.

리뷰 스키마 마크업을 위해 Llama를 사용할 때 저지르는 3가지 실수

이 워크플로우(workflow)에서 발생하는 대부분의 오류는 Llama를 단순히 플러그 앤 플레이 (plug-and-play) API처럼 취급하는 데서 비롯됩니다. 사실 Llama는 세심한 프롬프트 설계 (prompt design)와 출력 유효성 검사 (output validation)를 통해 보상을 받는 모델입니다. 아래의 세 가지 실수는 공통된 특징을 가지고 있습니다. 사람들이 선택 사항이라고 느껴 단계를 건너뛰고, 그 결과 깨진 리치 결과 (rich results)를 디버깅하는 데 몇 시간을 허비하며 정작 그것이 깨졌다는 사실조차 인지하지 못한다는 점입니다. 피해야 할 사항과 대신 해야 할 일은 다음과 같습니다:

- 실수 1: 주입 (injection) 전 출력 유효성 검사 생략. Llama는 구글의 스키마 요구 사항을 충족하지 못하는, 구문론적으로는 유효한 JSON을 반환할 수 있습니다. 예를 들어, ratingValue가 4 (정수, integer) 대신 "4" (문자열, string)로 반환되는 것만으로도 리치 결과가 표시되지 않을 수 있습니다. 생성된 스키마가 실제 페이지에 적용되기 전에 항상 유효성 검사기 (validator)를 통해 실행하십시오. 저희의 메타 태그 분석 도구 (analyze your meta tags tool)를 사용하면 스키마 확인과 함께 페이지 수준에서 충돌하는 구조화된 데이터 (structured data) 신호를 찾아낼 수 있습니다.

실수 2: 모든 리뷰 유형에 하나의 범용 프롬프트 사용. 제품 리뷰 (product reviews)에 완벽하게 작동하는 프롬프트라도 소프트웨어 리뷰 (software reviews)나 로컬 비즈니스 리뷰 (local business reviews)에 적용하면 환각 (hallucinate) 현상이 발생하여 필드를 잘못 생성할 수 있습니다. 리뷰 하위 유형 (Review subtypes)에 따라 필수 및 권장 속성 (properties)이 크게 다르기 때문입니다. 처리하려는 각 주요 리뷰 카테고리별로 별도의 리뷰 스키마 마크업 프롬프트를 작성하고, 대량으로 실행하기 전에 최소 20개의 예시를 통해 테스트하십시오.
...

SEOintent로 리뷰 스키마 마크업 자동화하기

만약 Llama 인프라를 직접 관리하고 싶지 않다면, SEOintent가 단 하나의 프롬프트(prompt)도 작성할 필요 없이 전체 파이프라인을 처리합니다. 스키마 자동화 (Schema Automation) 기능은 CMS 또는 연결된 데이터 소스에서 리뷰 데이터를 직접 가져오고, 위에서 설명한 것과 동일한 Llama 기반 워크플로우를 사용하여 검증된 JSON-LD를 생성하며, 정해진 일정에 따라 페이지에 이를 삽입합니다. 그다음 AI SEO 감사 (AI SEO Audit) 기능이 매주 리치 결과 (rich result) 적격성을 모니터링하고, 콘텐츠 변경으로 인해 스키마가 깨질 경우 알림을 보냅니다. 전체 기능 세트는 SEOintent features 페이지에서 확인할 수 있으며, 클라이언트 사이트를 운영 중이라면 agency partner program에 핵심 결과물로서 화이트 라벨 (white-label) 스키마 자동화가 포함되어 있습니다.