내 Hermes Agent는 어떤 계약서가 법적 검토를 필요로 하는지 결정하지 못했다. 하나의 Planning Layer가 이를 해결했다. 📑🤖

요약

Hermes Agent를 활용하여 기업용 계약서 검토를 자동화하는 지능형 에이전트 구축 사례를 소개합니다. 초기 모델의 과도한 오탐 문제를 해결하기 위해 신뢰도 기반의 결정 레이어(Planning Layer)를 도입하여 실용적인 워크플로우를 구현했습니다.

핵심 포인트

Hermes Agent 기반의 기업용 계약 지능 에이전트 구축
단순 텍스트 추출을 넘어 계획, 도구 호출, 위험 추론 수행
신뢰도 점수(Confidence Score) 도입으로 오탐 문제 해결
계약 유형 감지부터 경영진 요약까지 이어지는 워크플로우 설계

이 글은 Hermes Agent Challenge: Build With Hermes Agent를 위한 제출물입니다.

내 Hermes Agent는 어떤 계약서가 법적 검토를 필요로 하는지 결정하지 못했다. 하나의 Planning Layer가 이를 해결했다. 📑🤖

내가 만든 것

기업용 AI 에이전트 (Enterprise AI agents)를 실험하던 중, 공통적인 문제를 발견했습니다:

계약서 검토는 고통스러울 정도로 수동적입니다.

공급업체 계약서 (Vendor agreements), 비밀유지계약서 (NDAs), 기본 서비스 계약서 (MSAs), 작업 기술서 (SOWs) 등은 법무 팀이 다음과 같은 사항을 수동으로 검사해야 하는 경우가 많습니다:

누락된 조항 (missing clauses)
불분명한 책임 (unclear liabilities)
컴플라이언스 격차 (compliance gaps)
해지 조건 (termination conditions)
서비스 수준 협약 (SLA) 정의

나는 다음과 같은 질문을 던지고 싶었습니다:

AI 에이전트가 무엇을 검토할지, 그리고 언제 에스컬레이션 (escalate)할지를 지능적으로 결정할 수 있을까?

그래서 나는 **Hermes Agent를 기반으로 하는 기업용 계약 지능 에이전트 (Enterprise Contract Intelligence Agent)**를 구축했습니다.

단순히 계약서에서 텍스트를 추출하는 대신, 이 에이전트는 작업을 계획(plan)하고, 도구(tools)를 호출하며, 위험 요소를 추론하고, 계약서가 실제로 법적 검토를 필요로 하는지 결정합니다.

흥미로운 점은 무엇일까요?

나의 첫 번째 버전은 처참하게 실패했습니다.

Hermes Agent는 거의 모든 계약서를 에스컬레이션했습니다.

비밀유지계약서 (NDAs).

공급업체 계약서 (Vendor agreements).

심지어 저위험 계약서까지도 말이죠.

기술적으로 시스템은 작동했습니다.

하지만 실용적으로는?

완전히 사용할 수 없는 수준이었습니다.

문제는 단순했습니다:

에이전트에게 신뢰도 기반의 결정 레이어 (confidence-based decision layer)가 부족했던 것입니다.

단 하나의 조항이라도 위험해 보이면, Hermes는 즉시 에스컬레이션했습니다.

그것이 너무 많은 오탐 (false positives)을 만들어냈습니다.

그래서 나는 워크플로우 (workflow)를 재설계했습니다.

이제 Hermes Agent는 다음과 같이 동작합니다:

업로드된 계약서 읽기
계약 유형 감지
조항 추출
위험 신호 식별
신뢰도 점수 (confidence score) 계산
에스컬레이션 필요 여부 결정
경영진 요약 (executive summary) 생성

결과:

이제 Hermes는 규칙 기반 스크립트 (rule-based script) 대신 실제 기업 분석가 (enterprise analyst)처럼 훨씬 더 똑똑하게 행동합니다.

출력 예시:

Contract Type:
Vendor Agreement

...

저위험 계약서의 경우:

Contract Type:
NDA

...

데모

워크플로우 (Workflow)

Contract PDF
        ↓
Hermes Master Agent
...

에이전트 계획 (Agent Plan) 예시

업로드된 계약서 읽기
계약 유형 식별
중요 조항 추출
...

(스크린샷/비디오 워크스루 곧 추가 예정 🚀)

코드 (Code)

Repository:

의사결정 로직 예시:

class ContractDecisionAgent:

    def should_escalate(_
...

나의 기술 스택 (My Tech Stack)

Hermes Agent
Python
Azure Document Intelligence
PDFPlumber
PyPDF
FastAPI / Streamlit
LangChain
OpenAI / Azure OpenAI

Hermes Agent 활용 방법

Hermes Agent는 시스템의 중심에 위치합니다.

워크플로우를 하드코딩하는 대신, 저는 다음과 같은 목적으로 Hermes를 사용했습니다:

1. 계획 (Planning)

Hermes는 작업을 더 작은 추론 단계 (reasoning steps)로 나눕니다.

예시:

계약서 읽기
↓
유형 결정
...

2. 도구 사용 (Tool Use)

Hermes는 여러 도구를 동적으로 호출합니다:

parse_pdf()

extract_clauses()
...

계약 유형에 따라 서로 다른 추론 경로 (reasoning paths)가 필요하며, Hermes는 다음에 무엇을 할지 동적으로 선택합니다.

3. 다단계 추론 (Multi-Step Reasoning)

이 에이전트는 단순히 문서를 요약하는 것에 그치지 않습니다.

다음 사항들을 통해 추론합니다:

누락된 법적 조항 (missing legal clauses)
비즈니스 리스크 (business risk)
신뢰 수준 (confidence levels)
에스컬레이션 결정 (escalation decisions)

이는 AI 에이전트의 훨씬 더 현실적인 기업용 유스케이스 (enterprise use case)처럼 느껴졌습니다.

이 프로젝트를 구축하며 얻은 큰 교훈 하나는 다음과 같습니다:

에이전트 시스템 (Agentic systems)은 단순히 텍스트를 생성하는 것이 아니라, 다음에 무엇을 할지 결정할 수 있을 때 비로소 유용해진다.

그 지점이 바로 저에게 Hermes Agent가 진정으로 돋보였던 부분입니다.

읽어주셔서 감사합니다 🚀

hermesagentchallenge #devchallenge #agents #python

AI 자동 생성 콘텐츠

원문 바로가기

내 Hermes Agent는 어떤 계약서가 법적 검토를 필요로 하는지 결정하지 못했다. 하나의 Planning Layer가 이를 해결했다. 📑🤖

요약

핵심 포인트

내 Hermes Agent는 어떤 계약서가 법적 검토를 필요로 하는지 결정하지 못했다. 하나의 Planning Layer가 이를 해결했다. 📑🤖

내가 만든 것

데모

워크플로우 (Workflow)

에이전트 계획 (Agent Plan) 예시

코드 (Code)

나의 기술 스택 (My Tech Stack)

Hermes Agent 활용 방법

1. 계획 (Planning)

2. 도구 사용 (Tool Use)

3. 다단계 추론 (Multi-Step Reasoning)

hermesagentchallenge #devchallenge #agents #python

댓글