n8n Summarization Chain 노드: 워크플로우에서 긴 문서 및 웹 페이지 요약하기 [무료 워크플로우 JSON]
요약
n8n의 Summarization Chain 노드를 활용하여 긴 문서와 웹 페이지를 자동으로 요약하는 방법을 설명합니다. Map Reduce, Refine, Stuff 세 가지 전략을 통해 다양한 텍스트 길이에 최적화된 요약 워크플로우를 구축할 수 있습니다.
핵심 포인트
- LangChain의 요약 체인을 n8n 네이티브 노드로 제공
- Map Reduce, Refine, Stuff 세 가지 요약 전략 지원
- 청킹, 토큰 관리, 다중 패스 요약을 자동 처리
- LangChain Document 객체 입력을 필수 조건으로 함
n8n Summarization Chain 노드: 워크플로우에서 긴 문서 및 웹 페이지 요약하기 [무료 워크플로우 JSON]
n8n의 Summarization Chain 노드를 사용하면 코드 한 줄 작성하지 않고도 지원되는 모든 언어 모델 (Language Model)을 사용하여 PDF, 이메일, 웹 페이지, 트랜스크립트(Transcripts), 지식 베이스(Knowledge-base) 문서와 같은 긴 텍스트를 간결한 요약본으로 압축할 수 있습니다. 이 가이드에서는 모든 설정, 세 가지 요약 전략, 흔히 발생하는 실수, 그리고 오늘 바로 복사하여 사용할 수 있는 세 가지 워크플로우 패턴을 다룹니다.
Summarization Chain 노드의 역할
Summarization Chain 노드는 LangChain의 요약 체인(Summarization Chain)을 래핑(Wrap)하여 n8n의 네이티브 노드로 제공합니다. Document (Document Loader 또는 Convert-to-Document 노드로부터 가져온 것)를 입력하고, Chat Model을 연결하면 요약된 문자열을 결과로 받게 됩니다.
이 노드는 청킹 (Chunking), 토큰 관리 (Token management), 다중 패스 요약 (Multi-pass summarization)을 자동으로 처리하므로 수동으로 텍스트를 분할할 필요가 없습니다.
필수 입력 사항
| 입력 항목 | 필수 여부 | 설명 |
|---|---|---|
| Chat Model | 예 | n8n에서 지원하는 모든 LLM (OpenAI, Anthropic, Mistral, Ollama 등) |
| Document | 예 | 하나 이상의 Document 객체 (Document Loader 하위 노드로부터 가져온 것) |
중요: 이 노드는 가공되지 않은 텍스트 문자열이 아닌 LangChain Document 객체를 수락합니다. 반드시 Document Loader (Default Data Loader, PDF Loader 등)를 통해 데이터를 전달하거나 convertToDocument 표현식 헬퍼를 사용해야 합니다.
요약 유형 (전략)
노드는 세 가지 전략을 제공합니다. Summarization Type 드롭다운에서 선택하세요.
1. Map Reduce (기본값 — 긴 문서에 권장)
문서를 청크 (Chunks) 단위로 분할하여 각 청크를 독립적으로 요약하고 ("map"), 그런 다음 모든 청크 요약본을 하나로 다시 요약합니다 ("reduce").
- 가장 적합한 경우: PDF, 긴 트랜스크립트, 지식 베이스 문서, 여러 페이지의 문서
- 토큰 비용: 중간 (각 청크 + 최종 reduce 단계)
- 품질: 높음 — 각 청크가 모델의 전체 주의력 (Attention)을 받음
노출된 설정:
- Combine Map Summaries Prompt — reduce 단계에서 사용되는 프롬프트 (구조를 추가하기 위해 사용자 정의 가능)
2. Refine
청크를 순차적으로 처리합니다: 첫 번째 청크를 요약한 다음, 해당 요약본과 다음 청크를 모델에 전달하여 개선된 요약본을 생성하며, 완료될 때까지 이 과정을 반복합니다.
- 가장 적합한 경우: 문맥이 연대순으로 흐르는 서사적 텍스트 (회의록, 이야기, 이메일)
- 토큰 비용: 높음 — 각 단계마다 늘어나는 문맥을 참조함
- 품질: 일관된 서사적 출력
노출되는 설정:
- Refine Prompt — 각 개선 단계에서 주어지는 지침
3. Stuff
모든 문서 콘텐츠를 하나의 프롬프트에 집어넣고(Stuff) 한 번의 패스로 요약합니다.
- 가장 적합한 경우: 모델의 컨텍스트 윈도우 (Context Window) 내에 들어오는 짧은 문서
- 토큰 비용: 가장 낮음
- 주의사항 (Gotcha): 문서가 모델의 컨텍스트 제한을 초과하면 오류 없이 실패하거나 환각 (Hallucination) 현상이 발생합니다. 짧다고 확신할 수 있는 문서에만 사용하세요.
프롬프트 커스터마이징 (Prompt Customization)
세 가지 전략 모두 프롬프트 필드를 제공합니다. 기본 프롬프트는 일반적입니다 ("다음 내용을 간결하게 요약하세요..."). 구조화된 출력을 얻으려면 이를 재정의(Override)하세요:
다음 고객 지원 티켓을 2~3문장으로 요약하세요.
다음 사항에 집중하세요: (1) 고객의 핵심 문제, (2) 시도된 조치, (3) 해결 상태.
평문(Plain text)으로만 답변하세요.
프롬프트는 문서 콘텐츠의 자리 표시자(Placeholder)로 {text}를 사용합니다. 이를 제거하지 마세요.
출력 (Output)
노드는 하나의 필드를 가진 단일 아이템을 출력합니다:
{ "response": "여기에 요약 텍스트가 표시됩니다..." }
다운스트림(Downstream)에서 {{ $json.response }}를 통해 접근할 수 있습니다.
6가지 흔한 실수 (Common Gotchas)
1. Document 객체 대신 원문 텍스트(Raw text)를 전달하는 경우
노드는 일반 문자열을 거부합니다. Data 필드에 텍스트를 넣고
3. 사용자 지정 프롬프트에 {text} 플레이스홀더가 없는 경우
노드는 {text}를 통해 문서 내용을 주입합니다. 만약 이 플레이스홀더를 사용자 지정 프롬프트에서 제거하면, 모델은 빈 문자열을 요약하고 일반적인 채움(filler) 값을 반환합니다.
4. 많은 청크로 Map Reduce 사용 시 느린 실행 속도
각 청크는 별도의 API 호출입니다. 1,500 토큰 크기의 청크를 가진 50페이지 PDF의 경우, Map Reduce 전략을 사용하면 20개 이상의 API 호출이 발생할 수 있습니다. 할당량(rate limits)과 지연 시간(latency)에 유의하세요. 매핑(map) 단계에는 더 빠르고 저렴한 모델(예: GPT-4o-mini, claude-haiku)을 사용하세요.
5. Document Loader 노드 필수 — HTTP Request 노드 출력물 아님
HTTP Request 노드를 Document 입력에 직접 연결할 수 없습니다. 이들 사이에 Document Loader(예:
활용 사례(Use case): 에이전트(Agents)가 스레드를 읽기 전, 모든 티켓 상단에서 2문장으로 된 요약을 확인합니다. 이는 처리 시간(handle time)을 단축합니다.
패턴 3: 일간 뉴스 요약 (Nightly News Digest)
트리거(Trigger): Schedule Trigger (매일 오전 6시)
→ RSS Feed Read 노드 (10개 이상의 기술 피드)
→ Split In Batches (각 기사 URL 처리)
→ HTTP Request (기사 HTML 가져오기)
→ HTML Extract (본문 텍스트 추출)
→ Default Data Loader
→ Summarization Chain (Map Reduce 방식, 프롬프트(prompt): "이 기사를 3문장으로 요약하세요. 주요 주장과 모든 데이터 포인트를 포함하세요.")
→ Aggregate (모든 요약본 수집)
→ Basic LLM Chain (단일 요약 이메일로 결합)
→ Send Email (Gmail 노드)
활용 사례(Use case): 10개의 기사를 30분 미만의 읽기 분량으로 매일 요약하여 수신 — 모두 AI로 요약됨.
무료 워크플로우 JSON (Free Workflow JSON)
다음은 n8n에 직접 가져올 수 있는 최소 기능의 Summarization Chain 워크플로우입니다:
{
"name": "Summarization Chain — Starter",
"nodes": [
...
위의 세 가지 패턴 중 하나라도 완전한 구현을 원하시나요? n8n Workflow Starter Pack에는 오류 처리(error handling), 재시도 로직(retry logic), Slack/이메일 전송 기능이 내장된 세 가지 패턴 모두의 프로덕션 준비 완료(production-ready) 버전이 포함되어 있습니다.
Summarization Chain vs 기타 n8n 노드
| 노드 | 최적 용도 | 청킹 (Chunking) | 출력물 |
|---|---|---|---|
| Summarization Chain | 길이에 상관없는 긴 문서 | 자동 (Automatic) | 요약 문자열 (Summary string) |
| ... |
핵심 요약 (Key Takeaways)
- 약 3,000단어 이상의 문서에는 Map Reduce를 사용하세요.
- 순서가 중요한 서사적 콘텐츠에는 Refine을 사용하세요.
- 길이가 짧고 명확히 알려진 문서에만 Stuff를 사용하세요.
- 프롬프트(prompt)를 항상 맞춤 설정하세요 — 기본값은 일반적입니다.
- 출력물은 항상
{{ $json.response }}입니다. - 가공되지 않은 텍스트 노드가 아닌, Document Loaders와 함께 사용하세요.
Summarization Chain은 청킹(chunking), 토큰 제한(token limits), 또는 다단계 프롬프트(multi-step prompts)를 직접 관리하지 않고도 모든 n8n 워크플로우에 문서 지능(document intelligence)을 추가할 수 있는 가장 깔끔한 방법입니다.
n8n으로 문서 처리 파이프라인 (document processing pipelines)을 구축하고 계신가요? n8n Workflow Starter Pack에는 PDF 수신함용, 고객 지원 티켓 요약용, 그리고 야간 뉴스 요약용 등 즉시 실무에 적용 가능한 요약 워크플로우가 포함되어 있습니다 — $29, 즉시 다운로드 가능.
AI 자동 생성 콘텐츠
본 콘텐츠는 Dev.to AI tag의 원문을 AI가 자동으로 요약·번역·분석한 것입니다. 원 저작권은 원저작자에게 있으며, 정확한 내용은 반드시 원문을 확인해 주세요.
원문 바로가기