Claude API로 블로그 기사를 자동 생성하는 실전 가이드

서론

블로그를 지속적으로 업데이트하는 것은 생각보다 힘든 일입니다. 소재 발굴, 구성 검토, 집필, 교정… 매번 이 사이클을 돌리는 것은 시간적 비용이 많이 듭니다.

"이왕이면 기술적으로 해결할 수 없을까?"라는 생각에 Anthropic이 제공하는 LLM인 "Claude"의 API를 사용하여 블로그 기사 자동 생성 파이프라인을 구축해 보았습니다. 본 기사에서는 그 구현 과정을 코드와 함께 자세히 해설합니다.

또한, "자동 생성 = 품질이 낮다"라는 이미지를 가진 분들도 계시겠지만, 프롬프트 설계(Prompt Design)와 후처리(Post-processing)를工夫함으로써 실용적인 수준의 퀄리티를 실현할 수 있습니다. 그 점을 포함하여 소개하겠습니다.

전체적인 메커니즘 (아키텍처 개요)

이번에 구축한 시스템의 전체 모습은 다음과 같습니다.

[토픽 입력]
↓
[아웃라인 생성 (Claude)]
...

왜 섹션을 나누어 생성하는가

처음에는 "토픽을 전달하여 한 번에 기사 전체를 생성하는" 접근 방식을 시도했습니다. 하지만 다음과 같은 문제가 발생했습니다.

토큰 제한(Token Limit)에 걸림: 장문을 한 번에 출력하려고 하면 중간에 끊김 -
구성이 들쭉날쭉함: 헤딩(Heading) 구조가 매번 달라 품질이 안정되지 않음 -
수정하기 어려움: 일부만 재생성하고 싶을 때 전체를 다시 실행해야 함

그래서 "아웃라인(뼈대)을 먼저 확정하고, 섹션별로 본문을 생성하는" 2단계 방식으로 전환했습니다. 이를 통해 안정성과 유연성이 대폭 향상되었습니다.

구현 단계

Step 1: 환경 구축

먼저 필요한 라이브러리를 설치합니다.

pip install anthropic python-dotenv

API 키는 .env 파일로 관리합니다.

# .env
ANTHROPIC_API_KEY=sk-ant-xxxxxxxxxxxxxxxxxx

Step 2: Claude 클라이언트 초기화

import os
from anthropic import Anthropic
from dotenv import load_dotenv
...

Step 3: 아웃라인 생성

토픽을 받아 기사의 뼈대가 되는 아웃라인을 JSON 형식으로 출력하게 합니다. JSON 형식으로 하는 이유는 후속 처리에서 파싱(Parsing)하기 쉽게 하기 위해서입니다.

def generate_outline(topic: str) -> dict:
prompt = f"""
당신은 기술 블로그의 편집자입니다.
...

Step 4: 섹션별 본문 생성

아웃라인의 각 섹션을 순서대로 전개합니다. 전후 문맥을 시스템 프롬프트(System Prompt)로 제공함으로써 기사 전체의 일관성을 유지합니다.

def generate_section(title: str, heading: str, points: list[str]) -> str:
points_text = "\n".join(f"- {p}" for p in points)
prompt = f"""
...

Step 5: 기사 조립 및 출력

생성된 파츠(Parts)를 조합하여 완성된 기사를 구축합니다.

def generate_article(topic: str, output_path: str = None) -> str:
print(f"[1/2] 아웃라인을 생성 중...")
outline = generate_outline(topic)
...

Step 6: 실행해 보기

python generate_article.py

[1/2] 아웃라인을 생성 중...
제목: FastAPI로 시작하는 REST API 개발: 기초부터 실전까지
섹션 수: 5
...

약 30~45초 만에 Markdown 파일이 생성됩니다.

빠졌던 부분 · 주의점

1. JSON 파싱 에러

아웃라인 생성 시, Claude가 "```json" 코드 블록으로 감싸서 반환할 때가 있습니다.

import re
def extract_json(text: str) -> dict:
# 코드 블록을 제거
text = re.sub(r"```json\n?", "", text)
text = re.sub(r"```\n?", "", text)
return json.loads(text.strip())

프롬프트에 JSON 이외의 문자열은 출력하지 말 것 ...

import time
from anthropic import RateLimitError

def call_with_retry(fn, retries=3, wait=10):
    for attempt in range(retries):
        try:
            return fn()
        except RateLimitError:
            if attempt < retries - 1:
                print(f"Rate Limit (속도 제한)에 도달했습니다. {wait}초 후에 재시도합니다...")
                time.sleep(wait)
            else:
                raise

3. 생성 내용의 품질 관리

자동 생성이기 때문에, 가끔 사실과 다른 기술(이른바 할루시네이션 (Hallucination))이 혼입됩니다. 완전한 자동화는 어려우며, 최종적으로는 인간에 의한 리뷰가 필요합니다.

실제 운용에서는 "초안 생성 → 인간이 리뷰 및 수정 → 공개"라는 흐름으로 진행하고 있습니다. 완전 자동화가 아니라, 집필 시간을 단축하는 도구로서 위치를 잡는 것이 현실적입니다.

4. 모델 선택에 대하여

이번에는 claude-opus-4-5를 사용했지만, 용도에 따라서는 claude-haiku-3-5로도 충분한 품질을 낼 수 있습니다. 비용과 품질의 트레이드오프 (Trade-off)를 고려하여 선택해 주세요.

모델	특징	용도
claude-opus-4-5	고품질·고비용	실제 게시용 기사
...

요약 및 향후 전망

요약

이번에 구현한 포인트를 되돌아봅니다.

**2단계 생성 (아웃라인 → 본문)**을 통해 품질과 안정성 향상
섹션 분할로 토큰 제한 문제 회피
방어적인 JSON 파싱 (Parsing) 처리로 에러에 강한 구현
재시도 (Retry) 처리로 속도 제한 (Rate Limit) 대응

약 100줄의 Python 코드로, 토픽을 입력하는 것만으로 구성이 잘 짜인 Markdown 기사를 생성할 수 있게 되었습니다.

향후 전망

현재 시스템을 베이스로 하여, 다음과 같은 확장을 검토하고 있습니다.

1. CMS 연동

Zenn이나 Qiita의 API를 사용하여, 생성한 기사를 직접 초안으로 게시하는 기능을 추가하고 싶습니다.

2. RAG를 통한 정밀도 향상

자사의 문서나 과거 기사를 벡터 DB (Vector DB)에 저장하고, RAG (Retrieval-Augmented Generation)로 참조하게 함으로써 할루시네이션 (Hallucination)을 줄이는 방향을 검토 중입니다.

3. 여러 토픽의 배치 처리 (Batch Processing)

CSV로 토픽 리스트를 전달하여, 한꺼번에 기사를 생성하는 배치 처리도 구현할 예정입니다.

LLM을 단순히 "사용"하는 것에 그치지 않고, 파이프라인 (Pipeline)으로 구축하는 관점을 가지면 활용의 폭이 훨씬 넓어집니다. 꼭 자신의 유스케이스 (Use case)에 맞춰 커스터마이징해 보세요.

코드 전체는 GitHub에도 공개하고 있으니, 참고해 주시면 감사하겠습니다.