MCP 커넥터를 사용하여 ChatGPT에 웹 스크래핑 기능을 부여하는 방법 (2026)
요약
ChatGPT의 커스텀 MCP 커넥터를 활용해 웹 스크래핑 기능을 구현하는 방법을 설명합니다. 커넥터는 반드시 원격 HTTPS 서버여야 하므로, 로컬 도구를 사용하기 위해 REST API를 프록시하는 래퍼(wrapper) 구축이 필요합니다.
핵심 포인트
- ChatGPT 커넥터는 Plus 이상의 유료 플랜에서만 지원됩니다.
- 커넥터는 로컬 stdio 방식이 아닌 원격 HTTPS(SSE/HTTP) 방식만 지원합니다.
- 로컬 도구 사용 시 ngrok이나 Cloudflare Tunnel을 통한 터널링이 필요합니다.
- CrawlForge와 같은 로컬 도구를 쓰려면 원격 MCP 래퍼를 구축해야 합니다.
ChatGPT는 이제 웹 스크래핑 (web scraping)을 포함하여 사용자 정의 MCP 커넥터를 통해 사용자의 도구를 호출할 수 있습니다. 하지만 마케팅 페이지에서 생략된 함정이 하나 있습니다. 커넥터는 반드시 원격 (remote) 서버여야 하므로, CrawlForge와 같은 로컬 도구를 직접 붙여넣을 수 없습니다. 이것이 솔직한 버전입니다: 실제로 무엇이 가능한지, 왜 래퍼 (wrapper)가 필요한지, 그리고 구축해야 할 정확한 브릿지 (bridge)는 무엇인지에 대해 설명합니다.
요약 (TL;DR): ChatGPT 커스텀 MCP 커넥터 (2025년 12월에 "apps"로 명칭 변경)는 Developer mode를 통해 Plus, Pro, Business, Enterprise, 및 Edu 플랜에서 작동하며, Free/Go 플랜에서는 작동하지 않습니다. 커넥터는 반드시 원격 HTTPS 서버여야 하므로, CrawlForge와 같은 로컬 stdio 서버를 직접 추가할 수 없습니다. 해결책: CrawlForge의 REST API를 프록시 (proxy)하는 약 30줄 정도의 원격 MCP 래퍼를 만드는 것입니다.
목차
- ChatGPT 커넥터란 무엇인가
- 어떤 플랜에서 사용할 수 있는가
- 전송 방식의 함정: 원격 전용
- 왜 CrawlForge에 래퍼가 필요한가
- 브릿지 구축하기
- ChatGPT에 커넥터 추가하기
- 인증 및 보안
- 더 간단한 대안
ChatGPT 커넥터란 무엇인가
ChatGPT는 **커스텀 MCP 커넥터 (custom MCP connectors)**를 지원합니다. 이는 2025년 12월에 **"apps"**로 명칭이 변경되어, 현재 UI에는 "Apps & Connectors"라고 표시됩니다. Developer mode를 통해 외부 MCP 서버를 연결하면, ChatGPT는 대화 도중에 해당 서버의 도구를 호출하며, 쓰기 작업 (write action)을 수행하기 전에 사용자에게 확인을 요청합니다. Claude에서 웹 스크래핑을 가능하게 하는 것과 동일한 Model Context Protocol (MCP)이지만, 클라이언트가 다를 뿐입니다. Developer mode는 명시적으로 베타 (beta) 단계입니다.
어떤 플랜에서 사용할 수 있는가
OpenAI의 플랜 표에 따르면, 커스텀 MCP 커넥터를 추가하는 기능은 Free 또는 Go가 아닌 Plus, Pro, Business, Enterprise, 및 Edu에서 사용할 수 있습니다. 전체 쓰기 작업 지원은 Business, Enterprise, 및 Edu 플랜에 가장 광범위하게 출시되고 있습니다. 만약 ChatGPT가 스크래핑된 데이터를 _읽기_만 하면 된다면, 아래의 읽기 전용 (read-only) 경로만으로도 충분합니다.
전송 방식의 함정: 원격 전용
이 부분에서 사람들이 많이 실수합니다. ChatGPT 커넥터는 반드시 HTTPS를 통해 접근 가능한 원격 MCP 서버(SSE 또는 Streamable HTTP 전송 방식)여야 합니다. 사용자는 URL을 붙여넣는 것이지, 자신의 머신에 있는 명령어를 가리키는 것이 아닙니다. 따라서 npx로 설치하는 방식인 로컬 stdio 서버는 사용할 수 없습니다. 이를 사용하려면 서버를 공개적으로 호스팅하거나, ngrok 또는 Cloudflare Tunnel을 통해 로컬 서버를 터널링해야 합니다.
명명 규칙(naming rule)도 존재합니다. ChatGPT의 심층 조사(deep research) / 기업 지식(company-knowledge) 경로를 사용하려면 특정 스키마를 가진 search 및 fetch라는 이름의 두 가지 읽기 전용 도구가 필요합니다. 전체 **개발자 모드(Developer mode)**에서는 임의의 도구를 허용하므로, 이 제약 사항은 심층 조사 경로에만 적용됩니다.
CrawlForge에 래퍼(Wrapper)가 필요한 이유
CrawlForge는 npx를 통한 로컬 stdio MCP 서버와 https://www.crawlforge.dev/api/v1/tools/에 위치한 REST API 형태로 제공됩니다. 둘 다 원격 MCP URL이 아니며, 도구의 이름 또한 심층 조사 기능이 기대하는 search/fetch 쌍이 아닌 search_web, fetch_url, extract_content로 되어 있습니다. 따라서 현재로서는 CrawlForge를 ChatGPT에 바로 붙여넣을 수 없습니다. 실질적인 해결책은 약 30줄 정도의 **가벼운 원격 MCP 래퍼(thin remote MCP wrapper)**를 만드는 것입니다.
브릿지(Bridge) 구축하기
FastMCP (Python)는 ChatGPT가 원하는 search + fetch 도구를 노출하는 원격 MCP 서버를 구축하는 가장 빠른 방법입니다. 각 도구는 X-API-Key 헤더에 사용자의 cf_live_ 키를 담아 CrawlForge의 REST API를 호출합니다.
server.py — 전체 브릿지 코드
import os
import httpx
from fastmcp import FastMCP
...
서버를 실행하고 HTTPS를 통해 노출하세요. 빠른 테스트를 위해 로컬 포트를 터널링할 수 있습니다:
pip install fastmcp httpx
export CRAWLFORGE_API_KEY="cf_live_your_key_here"
python server.py
...
개발자 모드(Developer mode)를 사용하는 경우, search/fetch라는 이름을 생략하고 도구를 CrawlForge와 일대일로 매핑할 수 있습니다. 즉, scrape_structured, stealth_mode 또는 deep_research를 직접 노출할 수 있습니다. 방식은 동일합니다.
ChatGPT에서 커넥터 추가하기
- Settings (설정) → Apps & Connectors (앱 및 커넥터) → Advanced (고급) → Developer mode (개발자 모드) 활성화.
- Apps & Connectors (앱 및 커넥터) → Create (생성).
- 공개 HTTPS MCP URL (예: ngrok URL 뒤에
/mcp를 붙인 주소)을 붙여넣고, 이름을 지정한 뒤 인증 방식(auth method)을 선택합니다. - "I trust this application" (이 애플리케이션을 신뢰합니다) 체크박스를 확인합니다.
이제 search 및 fetch 도구가 나타납니다. 채팅에서 해당 커넥터를 선택하고 ChatGPT에게 특정 주제를 조사하도록 요청하면, ChatGPT가 search를 호출한 다음 CrawlForge를 통해 최적의 결과를 fetch합니다.
인증 및 안전 (Auth and Safety)
커넥터는 none (공개) 또는 OAuth 방식으로 인증합니다. UI에는 API 키 헤더(API-key-header) 옵션이 없으므로, 래퍼(wrapper)가 서버 측에서 CrawlForge 키를 보유하게 됩니다. ChatGPT는 쓰기 작업(write actions)을 수행하기 전에 확인 과정을 거치며, 사용자는 승인하기 전에 각 호출을 검사할 수 있습니다.
OpenAI의 경고를 진지하게 받아들이십시오: 신뢰할 수 있는 서버만 연결하십시오. 커스텀 커넥터는 프롬프트 인젝션 (prompt injection)을 포함한 위험을 증가시키며, 쓰기 작업 시 모델의 실수는 데이터를 파괴하거나 유출할 수 있습니다. 읽기 전용 (read-only) 스크래핑 브릿지는 위험도가 낮지만, 공유하기 전에 OAuth로 보안을 강화하십시오.
더 간단한 대안 (A Simpler Alternative)
무언가를 직접 호스팅하고 싶지 않다면, OpenAI Agents SDK 또는 Responses API를 사용하여 코드에서 CrawlForge를 사용하십시오. 원격 서버가 필요하지 않습니다. CrawlForge with the OpenAI Agents SDK를 참조하세요.
AI 자동 생성 콘텐츠
본 콘텐츠는 Dev.to AI tag의 원문을 AI가 자동으로 요약·번역·분석한 것입니다. 원 저작권은 원저작자에게 있으며, 정확한 내용은 반드시 원문을 확인해 주세요.
원문 바로가기