최근 대규모 언어 모델 (LLM)의 진화에 따라, 단순히 텍스트를 생성하는 것뿐만 아니라 자율적으로 태스크를 실행하는 「AI 에이전트 (AI Agent)」에 대한 주목이 높아지고 있습니다. 하지만 기존의 LLM은 훈련 데이터에 포함되지 않은 실시간 정보에 액세스하거나 외부 시스템을 직접 조작할 수 없습니다. 이러한 「정보의 비대칭성」과 「행동력의 결여」가 실무 응용에 있어 큰 과제가 되고 있습니다.

이 과제를 극복하기 위한 열쇠가 AI 에이전트에게 「손발」을 부여하는 「스킬 (Skill, 툴)」의 개발입니다. 본 기사에서는 AI 에이전트의 스킬 개발 전체상을 조망하고, Python을 이용한 심플한 구현 사례를 통해 그 메커니즘을 체계적으로 해설합니다.

AI 에이전트에서의 「스킬」 개념

AI 에이전트에서의 「스킬」이란, LLM이 외부 환경과 상호작용하기 위해 호출할 수 있는 「프로그램이나 API」를 가리킵니다. AI를 단순한 「고도의 대화 도구」가 아니라, 자율적으로 업무를 수행하는 「에코시스템 (Ecosystem)」으로서 기능하게 하기 위해서는 이 스킬의 설계가 필수적입니다.

예를 들어, 최신 주가 정보 취득, 데이터베이스 업데이트, 메일 전송 등은 모두 개별적인 「스킬」로 정의됩니다. LLM은 사용자의 요구(프롬프트)를 분석하여, 자신이 가진 「스킬」 중에서 최적의 것을 선택하여 실행합니다. 이 메커니즘은 오픈 소스 프레임워크인 「LangChain」이나, OpenAI가 제공하는 「Function Calling (함수 호출)」 기능에 의해 표준화되고 있습니다.

스킬 개발의 4가지 로드맵

AI 에이전트에 스킬을 구현하고 실행시키는 프로세스는 크게 다음과 같은 4가지 단계로 분류됩니다.

1. 스킬의 구체적 처리 구현

에이전트에게 실행시키고 싶은 구체적인 처리를 프로그램 (Python 함수 등)으로 기술합니다.

2. 메타데이터 정의 (스키마 작성)

LLM에 대하여 「이 스킬이 무엇을 수행하는 것이며, 어떤 인자 (Argument)를 필요로 하는가」를 설명하기 위한 설명문 (메타데이터)을 작성합니다. LLM은 이 정보를 바탕으로 어떤 스킬을 호출해야 할지를 판단합니다.

3. LLM에 의한 스킬 선택

사용자의 입력에 기반하여, LLM이 「실행해야 할 스킬」과 그 「인자」를 결정하고, 구조화된 데이터 (JSON 형식 등)로 출력합니다.

4.

실행 제어 (Dispatch)
LLM의 출력 결과를 받아, 실제 시스템 측에서 해당 프로그램을 실행하고 그 결과를 다시 LLM에 피드백합니다.

Python을 이용한 최소한의 스킬 구현 예시

여기에서는 위의 로드맵을 직관적으로 이해하기 위해, Python을 이용한 최소한의 구현 코드를 보여줍니다. 이번에는 "지정된 도시의 날씨를 가져오기"라는 심플한 스킬을 정의하고, 이를 에이전트가 선택하여 실행하는 흐름을 시뮬레이션합니다.

`python
import json

스텝 1: 스킬의 구체적인 처리 구현

def get_weather(location: str) -> str:
"""지정된 도시의 날씨를 반환하는 모의 함수"""

본래는 여기서 외부 날씨 API를 호출합니다

db = {
"東京": "晴れ、気温は22度です。",
"大阪": "曇り、気温は20度です。",
"ニューヨーク": "雨、気温は15度です。"
}
return db.get(location, "情報が見つかりませんでした。")

스텝 2: 메타데이터 정의

LLM에게 스킬의 존재와 사용법을 알리기 위한 정의

tools_definition = [
{
"name": "get_weather",
"description": "指定された都市の最新の天気を取得します。",
"parameters": {
"type": "object",
"properties": {
"location": {
"type": "string",
"description": "都市名（例：東京、大阪）"
}
},
"required": ["location"]
}
}
]

스텝 3: LLM에 의한 선택 (의사적인 LLM의 판정 로직)

def mock_llm_response(user_input: str):
print(f"ユーザー入力: {user_input}")
if "東京" in user_input and "天気" in user_input:
return {
"tool_to_call": "get_weather",
"arguments": {"location": "東京"}
}
return None

스텝 4: 실행 제어

def agent_executor(user_input: str):
decision = mock_llm_response(user_input)

if decision and decision["tool_to_call"] == "get_weather":
args = decision["arguments"]
print(f"-> エージェントが「get_weather」スキルの実行を決定しました。引数: {args}")

result = get_weather(args["location"])
print(f"-> 実行結果: {result}")

final_answer = f"「{args['location']}」の天気は「{result}」です。"
print(f"エージェントの最終回答: {final_answer}\n")
else:
print("適切なスキルが見つかりませんでした。\n")

실행 테스트

agent_executor("東京の今日の天気を教えてください。")
`

코드 해설

위의 코드에서는 시스템 개발자가 작성한 "get_weather"라는 프로그램을 메타데이터 (tools_definition)를 통해 에이전트에게 인식시키고 있습니다.
실무에서의 LLM (예를 들어 GPT-4 등)의 역할은 이 메타데이터를 해석하여, 사용자의 "날씨를 알려줘"라는 모호한 자연어로부터 {"location": "東京"}

라는 구조화된 데이터를 추출하는 데 있습니다.

시스템 측은 LLM이 반환한 이 구조화된 데이터를 받아, 그에 대응하는 함수를 실행합니다. 이와 같이 LLM은 직접 코드를 실행하는 것이 아니라, "어떤 코드를 어떤 인자(Argument)로 실행해야 하는가"에 대한 명령을 내리는 사령탑으로서 기능합니다.

스킬 개발이 가져오는 비즈니스 가치

AI 에이전트에 독자적인 "스킬(Skill)"을 통합하는 것은 단순한 기술적 확장에 그치지 않습니다. 사내의 독자적인 데이터베이스나 기존의 ERP 시스템, SaaS 도구의 API를 "스킬"로서 LLM에 학습 또는 등록함으로써, 지금까지 인간이 수작업으로 수행하던 데이터 입력이나 리포트 작성 등의 정형 업무를 완전히 자동화하는 것이 가능해집니다.

AI 에이전트를 자사의 비즈니스 프로세스에 통합하기 위한 첫걸음으로서, 우선 본 기사에서 소개한 것과 같은 심플한 스킬 정의부터 시작해 보시는 것은 어떨까요?

AI 에이전트의 「스킬」 개발 입문: 전체상 조망과 심플한 Python 구현

요약

핵심 포인트