
「판단 기준 설계」는 Excel 한 장으로 시작할 수 있다 — 업무 재고 조사가 AI 에이전트 설계의 전단계가 되는 이유
요약
AI 에이전트 도입 전, Excel을 활용해 업무를 '판단'과 '실행'으로 분류하는 설계 방법론을 제시합니다. 업무 재고 조사를 통해 자동화 가능한 영역과 인간의 개입이 필요한 영역을 명확히 구분하는 것이 에이전트 설계의 핵심입니다.
핵심 포인트
- 에이전트 설계 전 '판단 기준'을 먼저 설계해야 함
- Excel을 활용해 업무를 목록화하고 종별을 분류함
- 판단과 실행의 경계를 나누는 것이 에이전트 워크플로우의 핵심
- 분류된 데이터는 에이전트의 도구 호출 및 승인 단계 설계의 입력값이 됨
「업무를 자동화하고 싶다」 「AI 에이전트(AI Agent)를 도입하고 싶다」고 생각할 때, 많은 사람이 곧바로 도구 선정이나 프롬프트 설계(Prompt Design)부터 시작합니다. 하지만 그 전에 해야 할 수수하지만 강력한 공정이 있습니다. 그것이 바로 **「판단 기준의 설계」**입니다.
그리고 그 첫걸음은 놀라울 정도로 간단합니다. Excel(또는 스프레드시트) 한 장이면 충분합니다.
왜 「판단 기준의 설계」가 우선인가
자동화나 AI 에이전트화에서 좌절하는 전형적인 패턴은, 「무엇을 자동화해야 하는가」가 모호한 상태에서 수단부터 접근하는 것입니다.
업무에는 크게 두 종류가 있습니다.
판단 (Judgment): 문맥을 읽고, 선택지를 비교하며, 책임을 동반하는 의사결정을 하는 일
실행 (Execution): 판단이 끝난 후, 절차가 정해진 루틴 작업
AI 에이전트의 설계란, 궁극적으로는 「어디까지를 실행으로 위임하고, 어디서부터를 인간의 판단으로 남길 것인가」의 경계 나누기입니다. 이 경계 나누기를 먼저 하지 않고 에이전트를 구성하면, 「판단이 필요한 상황에서 멋대로 실행해 버린다」거나 「실행만으로 충분한 상황에 인간이 매달려 있게 된다」는 양방향의 사고가 발생합니다.
Excel 한 장으로 시작하는 구체적인 순서
실제로 하는 일은 단 3단계뿐입니다.
스텝 1: 업무를 목록화하기
먼저 자신(또는 팀)이 일상적으로 수행하는 업무를 끊임없이 써 내려갑니다. 입도(Granularity)는 제각각이어도 상관없습니다. 「견적서 작성」 「청구서 발행」 「채용 면접」 「클레임 1차 대응」 등 생각나는 대로 나열합니다.
스텝 2: 「판단 / 작업」 열 추가하기
각 업무에 대해 열을 하나 추가하기만 하면 됩니다.
| 업무 | 종별 | 위임 가능 여부 |
|---|---|---|
| 청구서 발행 | 작업 | 완전 자동화 가능 |
| ... |
스텝 3: 분포 살펴보기
목록이 채워지면 전체를 조망합니다. 여기서 많은 사람이 「생각보다 작업이 많다」는 사실을 깨닫게 됩니다.
어느 중소기업 경영자가 이 재고 조사를 수행했을 때, 결과는 이러했습니다. 「나만이 할 수 있는 일은 5건밖에 없었다」. 나머지 대부분은 기준만 언어화하면 누군가에게, 혹은 무언가에게 넘길 수 있는 작업이었던 것입니다. 이는 특수한 사례가 아니라, 재고 조사를 하면 상당히 높은 확률로 일어나는 「깨달음」입니다.
「판단」과 「작업」을 구분하는 판정 기준
종별 분류가 망설여진다면 다음 질문을 사용하면 정밀도가 높아집니다.
| 질문 | Yes가 많을수록 |
|---|---|
| 결과가 틀렸을 때, 책임을 묻는가 | 판단에 가까움 |
| ... |
중요한 것은, **「판단」과 「작업」은 이분법적인 선택이 아니라 그라데이션(Gradation)**이라는 점입니다. 위의 표에서 「문의 1차 분류」를 「판단(경량)」으로 설정한 것처럼, 규칙화할 수 있는 판단은 기준만 써 내려가면 실행 측으로 옮길 수 있습니다.
AI 에이전트 설계로의 연결
지금까지의 Excel은 그대로 AI 에이전트 설계의 입력값이 됩니다. 에이전트 설계에서 가장 먼저 하는 일이 바로 이 **「판단과 실행의 분리」**이기 때문입니다.
재고 조사에서 「작업」으로 분류한 업무는 에이전트의 도구(실행 액션)가 됩니다. 「판단」으로 분류한 업무는 인간의 승인 단계(Human-in-the-loop)가 됩니다. Excel의 세 번째 열인 「위임 가능 여부」를 그대로 설계 방침으로 옮길 수 있습니다.
예를 들어, 재고 조사 결과를 구조화하면 다음과 같습니다.
tasks:
- name: 請求書発行
type: execution
...
이 delegation 값이 에이전트의 워크플로우 분기 그 자체가 됩니다. full_auto는 도구 호출, conditional은 조건부 자동화 + 에스컬레이션(Escalation), human_only는 승인 대기 단계라는 식입니다.
도구는 어디서부터 검토해야 하는가
재고 조사가 끝나야 비로소 도구 선정이 의미를 갖습니다. 종별에 따라 궁합이 다릅니다.
| 종별 | 적합한 수단 | 예 |
|---|---|---|
| 순수 작업 | RPA · 스크립트 · 워크플로우 도구 | 정형 데이터 전기, 파일 정형 |
| ... |
여기서 강조하고 싶은 점은, 재고 조사를 건너뛰고 도구부터 접근하면 「판단」 업무에 고가의 자동화 기술을 적용하여 사고가 난다는 것입니다. 반대로 「작업」에 과도한 LLM을 적용하면 비용이 무의미하게 불어납니다. Excel 한 장의 재고 조사는 이러한 배분 실수를 방지하는 가장 저렴한 가드레일(Guardrail)입니다.
FAQ
Q. Excel이 아니어도 되지 않나요?
A. 상관없습니다. 핵심은 「업무 목록 × 유형 열」이라는 구조입니다. Notion이든 스프레드시트든, 최종적으로 YAML/JSON으로 변환하기 쉬운 형태라면 무엇이든 문제없습니다.
Q. 업무를 전부 다 적는 것이 너무 힘듭니다.
A. 완벽을 기할 필요는 없습니다. 우선 일주일 분량의 자신의 작업 로그를 작성하는 것만으로도, 판단과 작업의 비율은 충분히 파악할 수 있습니다.
Q. 「판단」이 너무 많아서 자동화할 여지가 없어 보입니다.
A. 그것은 대부분의 경우, 판단 기준이 언어화(Verbalization)되어 있지 않을 뿐입니다. 판정 기준표(책임·재현성·규칙화 가능성)를 통해 다시 질문해 보면, 「사실은 조건부 위임이 가능한 경량 판단」이 상당히 많이 발견됩니다.
요약 및 전망
AI 에이전트 (AI Agent) 설계의 본질은 똑똑한 프롬프트 (Prompt)를 작성하는 것이 아니라, 「인간이 판단을 보유하는 범위」를 명확히 정의하는 것입니다. 그 첫걸음은 Excel 한 장의 업무 재고 조사라는, 누구나 오늘 바로 시작할 수 있는 작업과 맞닿아 있습니다.
향후 에이전트의 자율성이 높아질수록, 「무엇을 맡기고 무엇을 맡기지 않을 것인가」의 경계, 즉 판단 기준의 설계야말로 인간에게 남을 핵심 기술이 될 것입니다. 도구는 변해도, 이 재고 조사의 사고방식은 퇴색되지 않습니다. 우선 Excel을 한 장 열고, 업무 목록에 열을 하나 추가하는 것부터 시작해 보세요.
이 글을 작성한 사람
BENTEN Web Works — 업무 자동화·AI 활용·시스템 개발 프리랜서 엔지니어입니다.
Claude Code / GAS / Python을 활용한 개발 및 AI 도입 상담을 진행하고 있습니다.
👉 업무 자동화 서비스 — 상세 내용 및 문의는 이쪽으로
🐦 X (구 Twitter) — 일상의 지견을 발신 중
Discussion

AI 자동 생성 콘텐츠
본 콘텐츠는 Zenn AI의 원문을 AI가 자동으로 요약·번역·분석한 것입니다. 원 저작권은 원저작자에게 있으며, 정확한 내용은 반드시 원문을 확인해 주세요.
원문 바로가기