무료 GPU로 AI 논문을 자동 재현하기 — Feynman과 Colab-MCP로 연구 파이프라인 구축하기 - Insights | Molayo

논문을 읽는 단계부터 실험을 돌리는 단계까지, 클라우드 비용 제로로 완결한다.

안녕하세요! 바야르(Bayar)입니다.

지난 2개월 동안, 하나의 질문을 쫓고 있었다.

"무료 도구만으로 'AI 과학자'에 가까운 연구 파이프라인을 만들 수 있을까?"

결론부터 말하겠다. 만들 수 있다. 게다가 예상보다 훨씬 실용적이었다.

사용하는 도구는 단 두 가지——Feynman(AI 리서치 에이전트)와 colab-mcp(Google Colab의 MCP 서버)다. 이를 조합하면 문헌 조사부터 실제 GPU 실험까지 거의 자동으로 흐르는 파이프라인이 완성된다.

해결하고 싶은 문제

ML(머신러닝) 연구에는 두 가지 현실적인 벽이 있다.

하나는 **계산 자원(Computing Resources)**이다. 로컬 머신으로는 본격적인 트레이닝(Training)을 돌릴 수 없다. 클라우드 GPU는 시간당 과금된다. A100 클러스터는 대학 연구실에나 있다.

또 하나는 정보의 밀도다. arXiv는 하루에도 수백 편의 논문을 공개한다. 수동으로 트리아지(Triage)하고 재현(Replication)까지 검증하는 것은 그것만으로도 전업이 될 수 있을 정도의 작업량이다.

이 파이프라인은 두 가지를 동시에 공략한다.

두 가지 도구

Feynman (feynman.is)

로컬에서 동작하는 오픈 소스(Open Source) AI 리서치 에이전트다. CLI(Command Line Interface) 도구로 사용한다.

주요 명령어:

명령어	용도
`feynman "질문"`	분야의 현황을 빠르게 파악
`feynman lit "토픽"`	합의점과 논쟁점을 포함한 깊이 있는 문헌 조사
`feynman deepresearch "토픽"`	멀티 에이전트(Multi-agent)를 통한 병렬 심층 조사
`feynman audit 2401.12345`	논문의 주장과 코드의 일치성을 감사(Audit)
`feynman replicate "논문 제목"`	완전한 재현 계획을 생성

특히 중요한 것은 마지막 두 가지다. audit은 논문의 주장과 코드 실체의 격차를 드러낸다——하이퍼파라미터(Hyperparameter)의 불일치, 데이터 처리의 생략, 평가 지표 정의의 차이 등이다. replicate는 환경 설정, 의존성 리스트, 하이퍼파라미터, 기대 지표 범위, 실험 절차를 구조화하여 출력한다.

colab-mcp (github.com/googlecolab/colab-mcp)

2026년 3월에 Google이 공개했다. MCP 프로토콜을 통해 AI 에이전트가 Google Colab의 노트북을 직접 조작할 수 있게 해주는 서버다.

실제 동작은 다음과 같다——Claude Code에 "이 코드를 Colab에서 실행해줘"라고 전달하면, 브라우저에 열려 있는 Colab 탭 안에 셀이 자동으로 생성되고, 코드가 작성되며, 실행되고, 출력이 다시 읽힌다.

그 Colab에는 무료 T4 GPU가 있다.

파이프라인의 전체상

feynman (연구 인텔리전스 계층)
↓ 재현 계획 생성
Claude Code (오케스트레이션 계층, colab-mcp 설정 완료)
...

Feynman이 논문을 읽는다. Colab이 실험을 돌린다. Claude Code가 그 신경계로서 양자를 연결한다.

사전 준비

5가지 도구, 모두 무료:

도구	설치	역할
uv	`curl -LsSf https://astral.sh/uv/install.sh	sh`
Feynman	`curl -fsSL https://feynman.is/install	bash`
Claude Code	`npm install -g @anthropic-ai/claude-code`	오케스트레이션 계층
colab-mcp	아래 셋업 참조	Colab MCP 서버
Google Colab	브라우저로 열기만 하면 됨	GPU 실행 환경

셋업 절차

Step 1: colab-mcp 설치

git clone https://github.com/SebastianGilPinzon/colab-mcp.git
cd colab-mcp

먼저 연결만 확인하고 싶다면 공식 버전으로도 동작한다:

uvx git+https://github.com/googlecolab/colab-mcp

Step 2: Claude Code MCP 설정

프로젝트 루트에 .mcp.json

를 생성한다.

공식 버전:

{
"mcpServers": {
"colab-mcp": {
...

커뮤니티 포크 (GPU 제어 기능 포함):

{
"mcpServers": {
"colab-mcp": {
...

Step 3: Feynman 설치

curl -fsSL https://feynman.is/install | bash
feynman --version

Step 4: Colab을 열고 Keep-alive 셀 추가

colab.google.com을 열고, 새 노트북을 생성하여 탭을 열어둔 상태로 유지한다.

첫 번째 셀에 다음 코드를 실행한다. 유휴 상태(Idle)로 인한 연결 끊김을 방지하기 위해 필수적이다:

import threading, time
def keep_alive():
while True:
...

이것으로 설정이 완료되었다.

5단계 워크플로우

페이즈 1: 문헌 정찰 (Literature Reconnaissance)

재현할 논문을 결정하기 전에, 분야의 전체적인 모습을 파악한다:

# 분야의 현황을 빠르게 파악
feynman "what do we know about space debris detection with deep learning"
# 합의점과 논쟁점을 포함한 심층 조사
...

페이즈 2: 논문 감사 (Paper Audit)

재현할 논문을 결정했다면, 코드에 손을 대기 전에 반드시 감사를 수행한다:

feynman audit 2401.12345
# 출력: 논문의 주장 vs 실제 코드의 차이점 리포트
# 주목할 점: 하이퍼파라미터 (Hyperparameter), 데이터 전처리 (Data Preprocessing), 평가 지표 (Evaluation Metrics)의 정의

페이즈 3: 재현 계획 생성 (Replication Plan Generation)

feynman replicate "Enhanced YOLOv8 for space debris detection" > replicate_plan.md

생성되는 replicate_plan.md의 내용:

데이터셋 취득 방법
의존성 리스트 (pip install로 바로 사용 가능)
하이퍼파라미터 (Hyperparameter) 설정
기대되는 지표 (Accuracy / mAP / Loss의 범위)
단계별 실험 흐름

페이즈 4: Colab에서 실행

계획을 Claude Code에 전달한다:

claude "
replicate_plan.md를 읽고, Colab 내에서 다음 순서로 실행해 주세요:
1. 실험 목표를 설명하는 마크다운 (Markdown) 셀을 생성
...

브라우저의 Colab 탭에 셀이 차례대로 자동 생성되며, 코드가 한 줄씩 실행되는 것을 보게 될 것이다.

GPU 선정 기준:

작업	설정	소요 시간
추론 및 빠른 검증	Colab T4 (무료)	몇 분
...

GPU 전환: 런타임 → 런타임 유형 변경 → T4 GPU.
커뮤니티 포크를 사용하면 Claude Code에 직접 "T4로 전환해줘"라고 말하기만 하면 된다.

페이즈 5: 결과 분석 (Result Analysis)

실험이 끝나면 Feynman에게 차이점 분석을 요청한다:

feynman "
실험 결과: [Colab의 출력을 붙여넣기]
대상 논문: [arXiv ID 또는 제목]
...

자주 발생하는 실패 패턴

문제	원인	대처법
Colab이 중간에 끊김	유휴 시간 초과 (Idle Timeout)	Keep-alive 셀을 실행한다
...		커뮤니티 포크 (모든 도구 사전 등록됨)를 사용한다
`feynman replicate`가 타임아웃됨	Docker 컨테이너의 리소스 제한	Feynman의 실행 계층을 건너뛰고, 계획만 Claude Code에 전달한다
Colab 출력이 끊김	셀 출력 길이 제한	파일로 쓰기: `open('results.txt', 'w')`

권장 디렉토리 구조

research-pipeline/
├── .mcp.json # colab-mcp 설정
├── papers/ # 논문 PDF와 arXiv ID
...

이 파이프라인의 범위

할 수 있는 것: 문헌 트리아지 (Literature Triage), 코드 감사 (Code Audit), 실험 복원, 베이스라인 비교, 결과 문서화. 계산 기반 연구 (ML · 데이터 분석 · 시뮬레이션)라면 실행 계층은 거의 모두 커버할 수 있다.

할 수 없는 것: 연구 방향의 판단, 예상치 못한 결과의 해석, 진정으로 새로운 가설의 생성. 이것들은 여전히 인간의 몫이다.

이것은 **힘의 증폭기 (Force Multiplier)**이지, 연구 자동화 기계가 아니다. 이 구분은 중요하다.

요약

이 파이프라인의 본질적인 가치를 한 문장으로 말하자면 다음과 같다.

연구실에 접근할 수 없는 독립 연구자가 연구실과 동일한 속도로 아이디어를 검증할 수 있게 된다.

무료 GPU · 자동화된 실험 실행 · AI 지원 문헌 조사 —— 이 세 가지의 조합은 2년 전에는 불가능했다. 지금은 도구들이 갖춰져 있다.

다음 단계

이 파이프라인에는 아직 한 가지 제약이 있다. Feynman의 기본 설정은 Docker 샌드박스에서 실행되며, Colab과는 독립된 계산 환경이다. 두 가지는 직접적으로 연동되어 있지 않다.

Feynman을 포크 (fork)하여 실행 백엔드를 colab-mcp로 교체하는 계획을 진행 중이다. 목표는 이 루프를 닫는 것이다:

Feynman이 가설을 생성
↓
colab-mcp가 실제 GPU로 실험을 실행
...

지금은 워크플로우 (Workflow) 단계다. 포크가 완성되면 자율적인 연구 루프가 될 것이다. 진행 상황은 후속 보고를 통해 전달하겠다.

참고 링크

colab-mcp 공식 리포지토리: https://github.com/googlecolab/colab-mcp
커뮤니티 포크 (GPU 대응): https://github.com/SebastianGilPinzon/colab-mcp
Feynman: https://feynman.is
Google Colab MCP 서버 발표: https://developers.googleblog.com/announcing-the-colab-mcp-server-connect-any-ai-agent-to-google-colab

스택 (Stack): Feynman + colab-mcp + Claude Code

무료 GPU로 AI 논문을 자동 재현하기 — Feynman과 Colab-MCP로 연구 파이프라인 구축하기

요약

핵심 포인트