Claude와 n8n을 활용하여 멕시코 중소기업용 프로덕션 WhatsApp AI 어시스턴트를 구축한 방법
요약
Claude와 n8n을 활용하여 멕시코 중소기업을 위한 24/7 WhatsApp AI 어시스턴트를 구축하는 방법을 소개합니다. 별도의 에이전트 프레임워크 없이 '메타 블록' 패턴을 사용하여 예약, 결제, 상담원 전환 등 11가지 기능을 안정적으로 구현했습니다.
핵심 포인트
- n8n, Claude Haiku, Postgres를 활용한 효율적인 기술 스택 구성
- 구조화된 '메타 블록' 패턴을 통한 예측 가능한 에이전트 로직 구현
- 벡터 DB 대신 Postgres를 활용한 경량화된 RAG 구현 방식
- WhatsApp Cloud API 직접 연동을 통한 비용 절감 및 통제권 확보
멕시코에서 WhatsApp은 단순한 채널이 아닙니다. 그것은 고객들이 가격을 문의하고, 예약을 잡고, 당신으로부터 구매할지 아니면 더 빨리 응답한 경쟁사로부터 구매할지를 결정하는 곳입니다. 그리고 마지막 부분이 문제입니다. 대부분의 중소기업들은 단순히 제때 답변하지 못해서 고객을 잃습니다. 업무 시간 외에든, 바쁜 시간에든, 혹은 사장님이 실제 업무를 하느라 바쁠 때든 말이죠.
멕시코 시티에서 운영하는 AI 자동화 에이전시 Proxxa에서 저희가 해결하는 가장 흔한 고통점(pain)이 바로 이것입니다. 그래서 저는 Claude와 n8n을 사용하여, 중간에 제3자 챗봇 플랫폼 없이도, 24시간 연중무휴로 답변하고, 고객을 자격 검증하며, 예약을 잡는 프로덕션급 WhatsApp AI 어시스턴트를 어떻게 구축했는지 설명하고자 합니다.
왜 직접 WhatsApp Cloud API를 사용해야 하는가 (BSP 불필요)
많은 가이드들이 WhatsApp Business API를 사용하려면 BSP(Business Solution Provider)가 필요하다고 말할 것입니다. 하지만 그럴 필요가 없습니다. Meta의 Cloud API는 Meta 자체에서 호스팅하며, 여기에 직접 구축할 수 있습니다. BSP를 건너뛰면 중간 관리자 비용이 들지 않고, 로직에 대한 완전한 통제권을 가지며, 고객이 자신의 번호와 데이터를 소유하게 됩니다.
스택(The stack)
- n8n: 오케스트레이션 레이어로서 작은 VPS에 Docker를 통해 자체 호스팅합니다.
- Claude (Haiku): 인텔리전스 레이어로 사용하며, 모든 메시지에 답변하기에 충분히 빠르고 저렴합니다.
- Postgres: 대화 기억(conversation memory), 지식 기반(knowledge base), 그리고 경량 CRM 용도로 사용됩니다.
- WhatsApp Cloud API: 메시징 기능을 담당합니다.
- Gemini: 음성 메모를 전사(transcribing)하는 데 사용됩니다.
강력하게 만든 패턴: 메타 블록 (meta-blocks)
별도의 '에이전트 프레임워크'를 붙이는 대신, 저는 Claude가 답변 안에 작은 구조화된 블록을 생성하도록 했습니다. 파싱 노드(parsing node)가 이 블록을 추출하고 제거한 후 전송하며 — 예약을 잡거나, 사람에게 에스컬레이션하거나, 리드를 포착하거나, 결제 링크를 생성하는 데 사용됩니다. 사용자들은 항상 깨끗한 텍스트만 보게 되며, 시스템은 그 블록에 반응합니다. 이 방식 덕분에 전체 시스템을 디버깅하고 예측 가능하게 유지할 수 있었습니다.
이러한 패턴을 통해 어시스턴트는 11가지 기능을 처리합니다: 자연어 대화 (natural-language conversation), 고객별 메모리 (per-customer memory), Google Calendar 예약 (Google Calendar booking), 비전 (vision) (고객이 보낸 사진을 읽음), 전체 문맥을 포함한 상담원 전환 (human handoff), 음성 메시지 이해 (voice-note understanding), 지식 베이스 (RAG), 경량 CRM, 다국어 응답, 그리고 채팅 내 결제 (payments) 기능입니다.
몇 가지 엔지니어링 교훈
벡터 데이터베이스 없는 RAG. 단일 기업의 지식 베이스(가격, 서비스, 정책)를 위해서는 Pinecone이 필요하지 않습니다. 저는 임베딩 (embeddings)을 Postgres에 텍스트로 저장하고, 코드 노드 (code node) 내부에서 코사인 유사도 (cosine similarity)를 실행하여 상위 구절을 추출했습니다. 이 정도 규모에서는 단순하고 저렴하며 충분히 정확합니다.
비전에는 적절한 버퍼 (buffer)가 필요합니다. 이미지를 단순히 바이트 단위로 가져오면 잘못된 base64 값이 생성되어 비전 엔드포인트 (vision endpoint)로부터 400 에러를 받게 됩니다. 해결 방법은 실제 버퍼를 반환하는 헬퍼 (helper)를 통해 바이너리 (binary)를 읽은 다음, 이를 base64로 인코딩하는 것이었습니다.
무료 티어에서의 음성 전사 (Voice transcription). Whisper에 비용을 지불하는 대신, 오디오를 Gemini로 직접 전송했습니다. Gemini는 WhatsApp 음성 메시지를 잘 전사하며 무료로 제공됩니다. 이는 마진이 낮은 시장에서 매우 큰 이점입니다.
결과
한 고객이 밤 11시에 서비스에 대해 문의하는 메시지를 보냅니다. 어시스턴트는 몇 초 만에 답변하고, 기업의 자체 지식 베이스에서 가격을 인용하며, 시간을 제안하고, 캘린더에 예약을 잡습니다. 그리고 대화에 사람이 필요할 경우, 전체 문맥과 함께 상담원에게 연결합니다. 예전에는 놓쳤을 메시지가 이제는 예약된 고객이 됩니다.
그것이 핵심입니다. 80%의 확률로만 작동하는 화려한 데모가 아니라, 기업이 고객을 놓치는 것을 조용히 막아주는 신뢰할 수 있는 어시스턴트 말입니다.
*Raphael Zamorano는 멕시코시티에 위치한 AI 자동화 에이전시 Proxxa의 설립자로, 중소기업을 위한 WhatsApp AI 어시스턴트를 구축합니다. 만약 당신이 멕시코에서 중소기업(SMB)을 운영하며 느린 응답 때문에 고객을 놓치고 있다면, 그것이 바로 Proxxa가 해결하는 문제입니다.
AI 자동 생성 콘텐츠
본 콘텐츠는 Dev.to AI tag의 원문을 AI가 자동으로 요약·번역·분석한 것입니다. 원 저작권은 원저작자에게 있으며, 정확한 내용은 반드시 원문을 확인해 주세요.
원문 바로가기