파이썬 200줄로 연구 시간을 80% 단축한 AI 에이전트 구축기

요약

본 글은 복잡한 프레임워크 의존성 없이, 파이썬의 기본 기능만으로 간결하고 효율적인 연구 에이전트를 구축하는 방법을 제시합니다. 200줄 내외의 코드로도 arXiv 스캔, 트위터 요약 등 다양한 정보를 수집할 수 있으며, 이를 통해 연구 시간을 크게 단축할 수 있습니다.

핵심 포인트

복잡한 프레임워크 대신 기본 파이썬 루프와 함수로 에이전트를 구축하세요.
작고 독립적인 도구(Tool)를 조합하여 모듈성을 높이는 것이 중요합니다.
시스템 프롬프트는 과도하게 설계하기보다 구체적이고 간결해야 합니다.
로컬 모델과 단순한 파싱 기법만으로도 충분히 강력한 연구 에이전트가 가능합니다.

지난달에는 논문 수집 및 요약에 15시간을 수동으로 사용했습니다. 이번 달은 어떨까요? 제 파이썬 에이전트가 제가 자는 동안 2시간 만에 끝냅니다.

문제점: 너무 많은 도구, 너무 적은 시간

저는 최신 정보를 유지하는 것이 arXiv를 매일 스캔하고, GitHub 트렌딩 레포지토리를 읽고, 트위터 스레드를 요약하며, 모든 것을 교차 참조해야 하는 분야에서 일합니다. 저는 수많은 탭에 파묻혀서 무엇이 중요한지 찾는 데 하루에 3~4시간을 날리고 있었습니다.

제가 온라인에서 찾은 모든 해결책들은 저를 다음 방향으로 이끌었습니다:

LangChain: LLM을 호출하기 위해서만 300개 이상의 의존성(dependencies) 필요
OpenAI Assistants: 도구 호출당 $0.03로, 금방 쌓입니다
"No-code" 플랫폼: 커스텀이 필요할 때까지는 좋지만요.

저는 간결하고 빠르며 제가 통제할 수 있는 무언가를 원했습니다. 그래서 처음부터 직접 만들었습니다.

아키텍처: 최대한 단순하게 유지하기

핵심 루프는 이렇습니다 (스포일러: 마법이 아닙니다):

import json
import requests
from typing import Callable
...

그게 전부입니다. 에이전트 루프가 60줄 미만입니다. 벡터 스토어(vector stores)도 없고, 콜백 지옥(callback hell)도 없고, 깊은 추상화 계층 구조도 없습니다.

도구: 작고, 조합 가능하며, 테스트 가능하게

저는 제 워크플로우의 90%를 커버하는 4가지 도구를 연결했습니다:

import arxiv
import feedparser
...

각 도구는 독립적인 함수입니다. 저는 이들을 개별적으로 테스트하거나, 교체하거나, 새로운 것을 추가해도 에이전트 루프를 건드릴 필요가 없습니다.

프롬프트: 영리하게가 아니라 구체적으로

대부분의 사람들은 시스템 프롬프트(system prompts)를 과도하게 설계합니다. 제 것은 이렇습니다:

You are a research assistant. When given a task:
1. Plan: what information do you need?
2. Use tools to gather that information.
...

그게 전부입니다. 체인-오브-쏘트(chain-of-thought) 템플릿도 없고, ReAct 프롬프팅도 없고,

프레임워크가 필요하지 않습니다. 에이전트 프레임워크는 아직 해결할 문제가 없는 문제를 해결합니다. while 루프와 함수 딕셔너리로 시작하세요.
로컬 모델만으로 충분합니다. Llama 3.2 8B도 도구 호출(tool calling)을 안정적으로 처리합니다. 연구 작업에 GPT-4가 필요하지 않습니다.
단순 파싱이 구조화된 출력보다 낫습니다. JSON 모드를 강제하는 것보다 TOOL:{...}END_TOOL 마커를 파싱하는 것이 더 신뢰성이 높습니다. 모델은 때때로 스키마를 환각(hallucinate)합니다.
도구를 독립적으로 테스트하세요. 각 도구가 단독으로 작동한다면, 에이전트가 작동합니다. 디버깅이 10배는 더 쉽습니다.

직접 시도해 보세요 (Try It Yourself)

전체 코드는 약 200줄입니다. 빠른 시작 방법은 다음과 같습니다:

git clone https://github.com/YOUR_USERNAME/simple-agent-research
cd simple-agent-research
pip install arxiv feedparser requests
...

Ollama를 로컬에서 실행하면 API 키가 필요 없습니다. LangChain 의존성 트리가 없습니다. 벤더 종속성(vendor lock-in)도 없습니다.

과장된 내용 없이 작고 집중적인 AI 에이전트를 구축합니다. 더 많은 실용적인 AI 엔지니어링 콘텐츠를 보려면 여기를 팔로우하세요. - 군더더기 없이, 작동하는 코드만 제공합니다.

AI 자동 생성 콘텐츠

원문 바로가기