화자가 다듬고 청자가 망설임 없이 받아들일 수 있는 AI Agent로 만드는 공통 전달 형식

회의실에서 자료가 투영된다. 페이지 수는 충분하다. 그래프도 있다. 배경 설명도 있다. 하지만 듣고 있는 쪽은 도중에 이렇게 생각한다.

「결국, 무엇을 결정해야 하는 거지?」

이것은 드문 장면이 아니다. 사내 제안, 기획 리뷰, 프로젝트 보고, 임원 설명. 많은 비즈니스 커뮤니케이션에서 화자는 분명히 말하고 싶은 것을 가지고 있다. 하지만 그것을 설명이나 자료로 만드는 순간, 과제·근거·결론·요구하는 판단의 연결이 약해져 메시지의 핵심이 흐릿해지는 경우가 있다.

청자 또한 자료마다 다른 자료 구성, 다른 어필 방법 속에서 결론이나 근거를 찾으며 이해하고 있다. 판단하기 전에 먼저 자료의 구조를 읽어내야 한다. 이 해석 비용은 회의 때마다 의외로 쌓이게 된다.

이번에 만든 것은 자료를 자동 생성하기만 하는 앱이 아니다. 사용자가 자신의 언어를 재검토하고, 상대에게 무엇을 전달할 것인지 철저하게 다듬을 수 있도록 하는 Agent 앱이다. 다듬어진 메시지는 화자와 청자가 동일한 틀로 주고받을 수 있는 공통의 전달 형식으로 변환된다.

즉, 이 앱의 목적은 「예쁜 슬라이드를 만드는 것」이 아니다. 자료가 되기 전의 메시지를 단련하여, 청자가 망설임 없이 받아들일 수 있는 형태로 만드는 것이다.

외부 고객용 프레젠테이션 자료를 위한 것이 아니다. 사람과 사람 사이의 정보 전달과 의사결정을 지원하기 위한 커뮤니케이션 툴에 비중을 둔 아이디어다.

생성형 AI(Generative AI)에게 「제안 자료를 만들어줘」라고 통째로 맡기면, 그럴싸한 아웃라인이나 슬라이드 안은 금방 나온다. 이것은 이미 많은 사람이 경험하고 있는 일이다.

하지만 슬라이드의 매수나 겉모습만 충분한 슬라이드는 쓸모가 없다. 오히려 겉모습은 훌륭한 슬라이드가 완성되었다 하더라도, 스스로 다음과 같은 질문에 명확히 답하지 못하는 경우도 자주 있다.

무엇을 과제로 삼고 있는가.
그 과제는 어떤 근거로부터 말할 수 있는가.
결론으로서 무엇을 단언하는가.
청자에게 무엇을 판단해 주길 원하는가.

이 4가지의 연결이 약한 채로 자료만 만들어도, 설령 겉모습이 훌륭하더라도 전달되지 않는다. 화자는 설명했다고 생각하지만, 청자는 결론을 찾고, 근거를 찾고, 판단 사항을 찾는다.

여기에 이번 앱의 출발점이 있다. AI에게 자료를 단순히 대필하게 하는 것이 아니라, AI와의 대화를 통해 사용자 스스로 자신의 메시지를 다듬을 수 있도록 한다. 이것이 처음에 정한 설계 사상이었다. 멋진 슬라이드를 만드는 것에 주력하는 것이 아니라, 슬라이드의 내용을 철저히 다듬은 뒤에 구조적인 스토리의 슬라이드를 작성할 수 있도록 한다.

그렇다면 그 「다듬는다」는 것은 구체적으로 무엇을 하는 것일까.

여기서 만들고자 한 것은 「좋은 프레젠테이션」의 유일한 정답이 아니다.

프레젠테이션에는 사람에 따라 다양한 유파가 있다. 스토리로 몰입시키는 사람이 있는가 하면, 데이터로 밀어붙이는 사람도 있다. 질문으로 시작하는 사람이 있는가 하면, 결론부터 시작하는 사람도 있다.

따라서 여기서 「강한 메시지란 이런 것입니다」라고 단정 짓고 싶은 것은 아니다.

이번 앱에서 다루고 싶었던 것은 조금 더 범위를 좁힌 것이다. 특히 사람에게 무언가를 판단하게 하기 위한 전달이다.

판단을 촉구하는 장면에서는 적어도 다음 4가지가 보일 필요가 있다.

1. 무엇을 과제로 삼고 있는가
2. 어떤 근거로부터 그렇게 말할 수 있는가
3. 결론으로서 무엇을 주장하는가
...

이것은 문장술의 규칙이라기보다, 판단을 위한 프로토콜(Protocol)이다.

물론 이 4가지를 나열하는 것만으로 좋은 제안이 되는 것은 아니다. 다만 여기가 모호한 채로 남아 있으면 청자는 「무엇을 결정해야 하는지」를 계속 찾게 될 것이다.

Agent는 이 4가지를 사용자를 대신해 멋대로 결정하는 것이 아니다. 사용자가 자신의 언어를 재검토하면서 「이 과제 설정이 맞는가」, 「이 근거로 단언할 수 있는가」, 「청자에게 무엇을 결정해 주길 원하는가」를 확인할 수 있도록 한다.

즉, 이 앱이 제공하는 것은 답 그 자체가 아니다. 판단을 견딜 수 있는 메시지로 다가가기 위한 질문과 틀이다.

이 경험을 단순한 채팅으로 끝내지 않기 위해 화면 설계도 채팅 중심으로 하지 않았다.

AI 앱을 만들다 보면 무심코 채팅 화면을 중심으로 만들고 싶어진다. 하지만 이번에 보여주고 싶은 것은 AI의 답변 문장이 아니다. 보여주고 싶은 것은 사용자의 메시지가 어떻게 재검토되고, 어디가 약하며, 어디까지 단언할 수 있는지이다.

그렇기 때문에 화면은 크게 3개로 나누었다.

왼쪽: 사용자의 발화와 대화의 흐름
오른쪽: 과제·근거·결론·요구하는 판단

ChatGPT의 Canvas/Artifact와 유사하다고 생각되지만, AI와 대화하면서 아웃풋 (Output)을 업데이트해 나갑니다.

채팅에서는 아무래도 AI의 답변이 주인공이 되기 마련입니다. 하지만 이번 앱에서는 주인공이 사용자의 메시지입니다. 에이전트 (Agent)는 그 메시지를 재검토하기 위한 질문을 던지고, 필요한 구조를 제시하는 역할에 집중하고 있습니다.

그렇다면 이 작업대에서 재검토한 메시지를 청자에게는 어떻게 전달해야 할까요?

최종적으로 이 앱은 5장의 Message-First Deck을 생성합니다. 슬라이드는 항상 5장으로 고정됩니다.

M1: 결론
M2: 전략·제약
M3: 요구하는 판단·행동
...

5장으로 설정한 것은 단순히 시각적인 템플릿을 만들기 위함이 아닙니다.

판단에 필요한 의미의 위치를 고정하기 위해서입니다.

청자는 매번 "결론은 어디인가", "근거는 어디인가", "무엇을 결정해야 하는가"를 찾을 필요가 없어집니다. M1에는 결론이 있다. M3에는 요구하는 판단이 있다. E1과 E2에는 그 주장을 뒷받침하는 근거와 실현 가능성이 있다.

반면, 화자에게도 이 형식은 제약이 됩니다.

결론이 약하면 M1이 약해집니다. 판단 사항이 모호하면 M3가 약해집니다. 근거가 부족하면 E1이 공허해집니다.

즉, 이 5장은 출력 형식인 동시에 메시지를 검사하는 틀이기도 합니다.

슬라이드는 최종 결과물처럼 보입니다. 하지만 실제로는 대화 속에서 재검토한 메시지를 청자가 망설임 없이 받아들일 수 있도록 배치한 것입니다.

이러한 사고방식을 구현하기 위해 에이전트 (Agent)와 MCP 서버의 역할도 나누었습니다.

이번 아키텍처 (Architecture)에서는 Azure AI Foundry Agent와 MCP 서버를 분리했습니다.

※ 실제로 사용할 때는 gpt-5.4 등 LLM, 최소한 gpt-5.4-mini를 사용하고 싶습니다. 이번에는 예산이 없어서 nano를 사용했습니다 (웃음).

에이전트 (Agent)의 업무는 사용자와의 대화를 통해 메시지를 재검토하는 것입니다. 후보를 제시하고, 질문을 던지며, 취약한 부분을 지적합니다.

MCP 서버의 업무는 확정된 메시지를 안정적인 형식으로 전개하는 것입니다. MCP 서버는 사용자를 대신해 결론을 내리지 않습니다. 대화의 결과로 굳어진 메시지를 5장의 공통 형식으로 변환합니다. MCP의 출력은 URL입니다. 사용자는 에이전트 (Agent)를 통해 해당 URL에 접속함으로써 즉시 프레젠테이션 가능한 슬라이드에 접근할 수 있습니다.

이러한 분리를 통해 에이전트 (Agent)는 대화와 판단에 집중할 수 있습니다. 반면 MCP 서버는 정해진 형식으로 재현성 있는 출력을 담당할 수 있습니다.

이번 프로젝트에서는 AI가 무엇이든 자동으로 만드는 것보다, 어디서 사람이 생각하고, 어디서 에이전트 (Agent)가 지원하며, 어디서 도구가 출력하는지를 명확히 하는 것에 중점을 두었습니다. 또한 최근 모델 가격이 급등하고 있어 비용 문제도 엄격합니다. 값비싼 LLM 토큰 (Token)으로 멋진 슬라이드를 만들기보다 고효율로 슬라이드를 작성합니다.

이 앱에서 가장 피하고 싶었던 것은 사용자가 말한 내용을 즉시 자료화하는 것입니다. 그렇게 되면 메시지의 핵심이 모호한 채로 겉모습만 정돈된 자료가 만들어지고 맙니다. 공들인 토큰 (Token)도 낭비하게 됩니다.

그래서 에이전트 (Agent)에게 처음부터 자료를 만들게 하지 않습니다. 먼저 사용자가 정말로 말하고자 하는 내용의 후보를 제시합니다. 그 후 과제·근거·결론·요구하는 판단의 연결성을 확인합니다.

근거가 약한 부분은 약하다고 지적합니다. 반론이 제기될 만한 점도 제시합니다. 아직 확언할 수 없는 부분도 명시합니다.

마지막에 무엇을 확언할지 선택하는 것은 사용자 자신입니다.

비즈니스 메시지의 힘은 화자 자신의 납득으로부터 나옵니다. 그렇기에 이 앱은 "AI가 만들어 주는 것"이 아니라, "AI와의 대화를 통해 자신의 메시지를 재검토하는" 경험을 중심으로 두고 있습니다.

지금까지의 흐름을 데모에서 구체적으로 보여드립니다.

에이전트 (Agent)에게는 먼저 머릿속으로 생각하고 있는 것을 말로 전달합니다. 다음과 같은 흐름으로 최종 슬라이드가 완성됩니다.

1. 사용자가 생각하고 있는 것을 말한다
2. 에이전트 (Agent)가 말하고자 하는 내용의 후보를 제시한다
3. 사용자가 가장 가까운 것을 선택한다
...

가치가 있는 것은 슬라이드가 나오는 것 자체가 아닙니다. 자료가 되기 전의 메시지가 판단을 견딜 수 있는 형태로 변하는 것입니다.

향후 강화하고 싶은 부분은 사내 정보와의 연결입니다. 다만 사내 데이터로부터 멋대로 주장을 만들어내는 것이 목적은 아닙니다. 주장은 어디까지나 사용자 내부에 존재합니다.

사내 데이터는 그 주장을 뒷받침하는 근거를 찾거나, 단정 지어서는 안 되는 부분을 확인하기 위해 사용합니다.

예를 들어, 회의록, 과거 제안 자료, SharePoint나 OneDrive 상의 문서와 연결할 수 있다면 다음과 같은 지원이 가능합니다.

- 이 주장을 뒷받침하는 과거의 논의를 찾기
- 근거가 부족한 부분을 나타내기
- 반론이 제기될 법한 논점 제시하기
...

ChatGPT 등에 단순히 데이터를 연결하더라도, 이를 활용하기 위해서는 사용자가 어느 정도 AI에 익숙해지고 능숙하게 다룰 필요가 있습니다. 하지만 자료를 작성하는 과정에서 AI가 먼저 사용할 만한 데이터나 근거가 될 만한 데이터의 후보를 제시해 준다면, 메시지를 더욱 다듬어 나가는 과정에서 자연스럽게 활용할 수 있을 것이라고 생각합니다.

회의실에서 자료가 투영됩니다. 페이지 수는 충분합니다. 그래프도 있습니다. 배경 설명도 있습니다. 그럼에도 불구하고 청자가 "결국, 무엇을 결정해야 하는 거지?"라고 생각하게 된다면, 부족한 것은 자료의 양이 아닙니다.

부족한 것은 화자 스스로가 재검토한 메시지와, 그것을 청자가 망설임 없이 받아들일 수 있는 전달 형식입니다. 이번에 만든 앱은 AI가 자료를 만들기 위한 것이 아닙니다. 화자가 자신의 언어를 재검토하고, 과제·근거·결론·요구하는 판단의 연결 고리를 확인하는 것. 그 메시지를 청자가 동일한 틀로 받아들일 수 있도록 하는 것입니다.

자료를 만들기 전에 말하고자 하는 바를 제대로 다듬어서 전달하는 것, 수신자가 그것을 망설임 없이 받아들일 수 있게 하는 것이 이 앱을 통해 실현하고 싶었던 것입니다.

화자가 다듬고 청자가 망설임 없이 받아들일 수 있는 AI Agent로 만드는 공통 전달 형식

요약

핵심 포인트

댓글