비즈니스 출신이 처음으로 AI 솔루션을 만들어 본 이야기: 딸의 그림을 LINE×Dify×Gemini로 분석하기
요약
본 기사는 비엔지니어 출신 필자가 '딸의 상상력'이라는 주제로 AI 솔루션을 개발한 과정을 기록하고 있습니다. 핵심은 AI가 딸의 그림을 직접 해석하거나 완성하는 것이 아니라, 부모(관찰자)의 관찰 능력을 확장해주는 '마법의 돋보기' 역할을 하는 것입니다. 이 시스템(Amulet)은 LINE Bot 형태로 구현되어, 그림 사진을 받으면 교육적 이론과 심리학적 지견을 바탕으로 구조화된 분석 정보를 제공하며, 특히 비교, 평가, 진단 등 부정적인 제약 조건을 설정하여 부모의 발견을 돕는 데 초점을 맞추고 있습니다.
핵심 포인트
- AI 솔루션 개발은 '완성된 프로덕트'가 아닌 '사고의 프로세스 기록'에 중점을 두었다.
- 핵심 컨셉은 AI가 상상력을 대체하는 것이 아니라, 부모의 관찰 능력을 확장하여 그림을 해석하도록 돕는 것이다 (마법의 돋보기).
- 레지오 에밀리아 교육 및 구성주의 등 다양한 교육 이론을 기반으로 시스템의 철학적 배경을 구축했다.
- 시스템(Amulet)은 LINE Bot 형태로 구현되어, '그 자리에서 즐기기'와 '깊이 알기' 두 가지 모드를 제공한다.
- 비교, 평가, 진단, 단정 등의 부정적 제약 조건(Negative Constraints)을 명시하여 AI의 역할을 제한하고 부모의 발견을 돕도록 설계했다.
※ 이 기사는 「완성된 프로덕트」가 아니라, 「사고의 프로세스와 첫걸음」에 대한 기록입니다.
시작하며
저는 40대 중반을 넘긴 사업 회사 근무의 비엔지니어입니다만, 향후 커리어를 AI 엔지니어로서 사회 과제를 해결하는 솔루션을 스스로 개발하고 사회 구현(Social Implementation)해 나가는 인생을 살고 싶다는 포부를 품었습니다.
그 첫걸음으로서, 「딸의 인생을 풍요롭게 만드는 무언가를 만들고 싶다」라는 막연한 희망으로부터 이 프로젝트는 시작되었습니다.
첫 번째 안과 그 위화감
딸은 상상력이 매우 풍부하여, 상상 속의 친구에 대해 이야기해 줄 때가 자주 있습니다.
이 이야기가 신기하면서도 흥미로웠기에, 이 상상 속의 친구를 그려내거나 친구가 이야기를 대답해 주는 것과 같은 AI 솔루션을 먼저 생각했습니다.
하지만 곧 위화감을 느꼈습니다.
상상 속의 존재에 대해, 그림이든 말이든 명확한 윤곽을 부여하는 것이 오히려 딸의 풍부한 상상력을 빼앗는 것이 아닐까.
딸에게 이 상상 속의 친구는 아마도 실재하는 존재일 것입니다.
그 유동적이고 풍부한 이미지를 AI가 「정답」으로 덮어써 버릴 위험을 느꼈습니다.
또한, 딸은 지금 그림 그리는 것을 좋아하며, 이 그리는 행위 자체를 통해 다양한 배움을 얻고 있기도 합니다.
필압의 강도, 선을 긋는 방식, 색의 선택—— 그 하나하나가 신체적인 시행착오의 축적입니다.
이를 AI가 대신함으로써 그 프로세스를 빼앗아 버리는 것에 대한 우려도 있었습니다.
그로부터 AI가 딸을 위해 무언가를 하는 것이 아니라, 내가 딸을 위해 하는 것을 AI가 서포트하는 것은 어떨까 생각하게 되었습니다.
그렇게 도달한 방향성이 바로,
딸이 그려주는 그림을 보는 부모(나)의 능력을 AI가 확장한다——
입니다.
컨셉의 확립: 「마법의 돋보기」로서의 AI
방향성을 정한 후, 「부모의 관찰안을 확장한다」는 것이 구체적으로 무엇을 의미하는지 생각했습니다.
그 답을 찾는 과정에서 몇 가지 교육 이론을 만났습니다.
중심에 둔 것은 다음의 두 가지 사상입니다.
레지오 에밀리아 교육 (Reggio Emilia Approach)
이탈리아에서 발상한 유아 교육 철학으로, 「아이에게는 100가지 언어가 있다」는 사상이 핵심입니다.
아이를 「권리의 주체」로 파악하며, 그 표현을 어른이 해석·기록하는 것을 중시합니다.
구성주의 (Constructivism)
지식은 가르쳐지는 것이 아니라, 환경과의 상호작용을 통해 스스로 구축하는 것.
딸이 그리는 프로세스 그 자체에 배움이 있다는 사고방식입니다.
이것들을 주축으로 뇌과학·발달심리학·몬테소리·슈타이너 교육의 지견을 보완적으로 조합했습니다.
왜 여러 지견으로 보완하려 했는가.
그것은 관찰안의 확장을 위해서는 단일 이론이 도출하는 정답이 아니라, 다양한 시점이 중요하다고 생각했기 때문입니다.
뇌과학, 발달심리학, 몬테소리, 슈타이너——
각각의 이론은 인류 시행착오의 역사입니다.
정보가 넘쳐나는 현대이기에 더욱, 과거의 위인들이 쌓아온 힘도 빌려 딸의 그림을 즐기고 싶습니다.
언젠가 딸이 이 도구의 존재를 알게 되었을 때,
「아빠는 이런 생각을 하면서 네 그림을 보고 있었단다」
라고 전할 수 있다면, 그 자체로 하나의 선물이 될 것이라고 생각합니다.
AI는 「아뜰리에리스타 (Atelierista)」 (레지오 에밀리아에서의 예술 교육 전문가)로서, 부모의 관찰을 보조한다.
부모가 딸의 그림을 보았을 때 깨닫지 못했던 시점을 AI가 제공한다.
「마법의 돋보기」처럼, 부모의 사랑의 해상도를 높이기 위한 도구로서 위치시킨다.
이것을 엔지니어적인 관점에서 정리하면, 이 프로젝트는
「딸의 그림이라는 비구조화 데이터 (Unstructured Data)를 교육적 문맥이라는 필터를 통해 구조화하고, 부모가 행동할 수 있는 정보로 변환한다」
라는 시도라고 재해석할 수 있을 것 같습니다.
또한, AI가 완결시키는 것이 아니라 부모라는 「인간」이 대화의 고리에 참여함으로써 성립한다는 의미에서, 휴먼 인 더 루프 (Human-in-the-loop)적인 시스템을 구축하고 있다고도 말할 수 있을지 모릅니다.
만든 것: 「그림의 번역가」 LINE Bot
시스템의 이름은 Amulet (아뮬렛)입니다.
딸을 지키고 그 성장을 기록하는 부적 같은 존재를 만들고 싶다는 마음에서 이름을 붙였습니다.
조작은 매우 심플합니다.
LINE으로 딸의 그림 사진을 보내면, AI가 분석해서 답장을 해준다.
단지 이것뿐입니다.
2가지 모드
모드 A 「그 자리에서 즐기기」
딸이 그림을 가져온 그 순간에 사용합니다.
이 그림에만 사용할 수 있는 구체적인 질문 3가지를 제안합니다.
예:
- 이 고양이님, 꼬리를 꼿꼿하게 펴고 있는데 지금 어떤 기분일까?
- 오른쪽 위에 있는 이 사람은, 이 예쁜 꽃을 보며 어떤 생각을 하고 있을까?
모드 B 「깊이 알기」
「자세히」라고 보내면 작동합니다.
딸이 잠든 후, 혼자서 차분하게 읽는 분석입니다.
4개의 섹션으로 구성되어 있습니다.
- 【그리는 동안 일어나고 있는 일】
- 【이 아이가 보고 있는 세계】
- 【더 함께 즐기기】
- 【남겨두고 싶은 성장】
설계상의 고집: Negative Constraints (부정적 제약 조건)
이 시스템에는 「절대로 하지 않을 것」을 명시적으로 정의하고 있습니다.
- 비교하지 않기 (다른 아이, 발달 표준치와의 비교 금지)
- 평가하지 않기 ("잘한다", "대단하다" 등의 평가어 금지)
- 진단하지 않기 (발달 지연을 시사하는 표현 금지)
- 단정·예언하지 않기 (재능이나 미래를 단정 짓는 것 금지)
- 부모에게 처방하지 않기 ("~해야 한다"라는 지도 금지)
이것들은 AI가 「답을 내는」 것이 아니라, 「부모의 발견을 돕기」 위한 설계입니다.
시스템 구성
전체 흐름
스마트폰 (LINE)
↓ 딸의 그림 사진을 보냄
LINE 서버 (Messaging API)
...
사용 기술 및 선정 이유
| 서비스 | 역할 | 선정 이유 |
|---|---|---|
| LINE Messaging API | 프론트엔드 (Frontend) | 일본의 부모에게 마찰이 가장 적은 인터페이스 |
| ... |
막혔던 포인트와 해결책
① Render의 슬립 (Sleep) 문제
무료 플랜은 15분이면 슬립 상태가 됩니다.
UptimeRobot을 사용하여 5분마다 자동으로 접속하게 함으로써 해결했습니다.
② 모드 전환 설계
LINE에서는 이미지와 텍스트를 동시에 보낼 수 없습니다.
「이미지를 보낸다 → 모드 A로 분석 → 「자세히」라고 보낸다 → 모드 B로 재분석」
이라는 설계로 해결했습니다.
③ 에러 핸들링 (Error Handling)
Dify나 Gemini의 타임아웃(Timeout)·쿼터(Quota) 초과에 대비하여,
try/except로 적절한 에러 메시지를 반환하는 설계로 했습니다.
GitHub는 여기 있습니다: https://github.com/ai-zawa/drawing-bot
배움과 깨달음
비즈니스 사이드 출신이기에 깨달을 수 있었던 것
이 프로젝트를 통해 한 가지 확신을 얻었습니다.
「'왜(Why)'를 말할 수 있는 것」은 기술만큼이나 중요한 스킬이다.
기술적인 구현은 AI의 힘을 빌리면서 찾아가며 진행하면 습득할 수 있습니다.
하지만 「무엇을 위해 만드는가」, 「누구의 어떤 과제를 해결하는가」를 언어화할 수 있다는 점에서는, 비즈니스 사이드 출신이라는 배경이 오히려 강점이 된다는 것을 실감했습니다.
UX와 기능의 트레이드오프 (Trade-off)
프롬프트 (Prompt)를 설계하는 과정에서 가장 고민했던 것은
「깊은 분석」과 「그 자리에서 바로 사용 가능함」 사이의 트레이드오프였습니다.
정보가 풍부하더라도 읽히지 않는다면 의미가 없습니다.
LINE이라는 인터페이스를 고려했을 때,
「그 자리에서 딸과 즐기는 것」을 우선시한 모드 A의 존재가 필수적이었습니다.
이 판단은 기술적인 문제가 아니라 UX (User Experience)의 문제였습니다.
비즈니스 사이드에서 쌓아온 「사용자 관점」이 빛을 발한 부분이라고 생각합니다.
다음 단계
현재 생각하고 있는 발전 방향은 다음과 같습니다.
- RAG 구현: 과거의 그림을 축적하여 AI가 성장의 변화를 해석할 수 있도록 함
- 성장 기록 아카이브: 그림 자체를 시계열로 저장하고 가족과 공유할 수 있는 기능
- 미술 학원과의 연계: 선생님이 보호자와 대화할 때의 지원 도구로서의 B2B2C 전개
마치며
이 프로젝트는 딸을 위해 시작했습니다.
하지만 어찌어찌 작동하는 것을 만들고 나서 깨달은 것은, 이것은 저 자신을 위한 것이기도 했다는 점입니다.
「AI 엔지니어로서 사회 과제를 해결한다」는 뜻을 말로만 그치지 않고 실제로 형태를 만드는 —— 그 첫걸음이 되었습니다.
40대 중반부터의 커리어 체인지는 결코 늦지 않다고 믿습니다.
「왜 만드는가」를 말할 수 있는 사람이 기술을 손에 쥐었을 때, 무엇을 할 수 있는지를 계속해서 증명해 나가고 싶습니다.
비슷한 생각을 가진 분, 육아 중이라 비슷한 과제를 느끼고 있는 분, 꼭 소감을 들려주세요.
GitHub: https://github.com/ai-zawa/drawing-bot
이 프로젝트는 현재도 진화 중입니다.
RAG 구현·성장 기록 기능·미술 학원 연계 등,
향후 전개도 Zenn에서 발신하겠습니다.
AI 자동 생성 콘텐츠
본 콘텐츠는 Zenn AI의 원문을 AI가 자동으로 요약·번역·분석한 것입니다. 원 저작권은 원저작자에게 있으며, 정확한 내용은 반드시 원문을 확인해 주세요.
원문 바로가기