보이스 저널링으로 디버깅과 튜닝하기: NotebookLM

저널링을 해보고 싶지만 종이와 펜이 보이지 않는다, 글로 쓰려고 하면 문장으로서 생각하게 되어 손이 움직이지 않는다... 페이퍼리스(Paperless) 시대에... 대체로 글씨가 악필이라 읽을 수 없다... 시간도 없다...

하지 않을 이유를 찾아내는 데 능숙한 변명 천재 P3입니다!

단순한 블로그 소재가 예상치 못한 결과로

이번에는 스마트폰의 보이스 메모와 NotebookLM을 이용한 보이스 저널링(Voice Journaling)입니다.

시작하게 된 계기는 "당 블로그의 소재" 찾기로서 AI와 조합하여 검증하면 재미있지 않을까? 라고 생각한 것이 시작이었습니다. 자기 분석 정도라고 생각했던 것이 의외의 결과로 이어지므로 읽어주시면 감사하겠습니다.

가능한 한 마찰(Friction)을 제로로 만들고 싶다

지속적으로 검증하기 위해 가능한 한 "언제든", "편하게", "간단하게"를 고려해 보았습니다.

스마트폰 (녹음할 수 있는 것이라면 무엇이든)

Gemini (익숙한 것이면 됨)

NotebookLM (데이터 저장 및 분석용, 무료/유료 상관없음)

Google AI Studio (개인적으로 사용하기 편한 것이면 된다고 생각함)

*참고로 iPhone → Mac이라면 iCloud 전송의 경우 마찰이 더욱 경감됩니다*

"전사(Transcription)가 필요할까?"라는 지적이 나올 것 같습니다만

NotebookLM에 저장할 수 있는 소스(Source) 수에 한계가 있다!

하루 1건씩 매일 수행할 경우 365건이 됩니다. 무료 버전은 50건, 최고 클래스는 600건.

전사(Transcription)를 해서 문서로 저장하고 한 달에 1개 파일로 만들면 무료 버전으로도 4년은 버틸 수 있습니다!

Google One 플랜	NotebookLM 소스 상한 수 / 1노트
무료 버전	50 소스
...
출처: Google One NotebookLM 공식 2026년 5월 시점

매일 처리하지 않는다. 전사는 "주간 배치(Weekly Batch)"로 돌린다

지속을 위한 또 다른 고안은 처리 타이밍입니다.

"녹음 → 전사" 플로(Flow)를 매일 수행하는 것은 운용 비용(마찰)이 높아 오래 지속할 수 없습니다. 그래서 평일에는 스마트폰에 음성 로그를 쌓아두기만 하고, 주말에 Google AI Studio를 사용하여 일주일 분량을 일괄적으로 전사하는 "주간 배치 처리"를 채택하고 있습니다.

AI의 출력을 안정시키는 "방어적 프롬프트(Defensive Prompt)"

Google AI Studio에 일주일 분량의 음성 파일을 여러 개 던져 넣고 전사를 실행시키는데, 여기서 중요한 것이 프롬프트(Prompt) 설계입니다.

프롬프트가 없어도 대략적인 전사는 해주지만, 생성형 AI 특유의 "출력의 흔들림(에러)"을 방지하고 확실성을 담보하기 위해, 저는 다음과 같은 프롬프트를 고정적으로 사용하고 있습니다.

일본어로 내용을 생략·요약하지 말고 전사하여, 시계열 순으로 출력해 주세요.

언뜻 보기에는 단순한 한 문장이지만, 여기에는 AI의 거동을 제어하기 위한 3가지 명확한 의도(에러 핸들링)가 담겨 있습니다.

일본어로 (언어 할루시네이션(Hallucination) 방지)

AI가 멋대로 눈치를 보거나, 음성 노이즈를 오인하여 영어로 출력해 버리는 에러를 미연에 방지합니다.

생략·요약하지 말고 (Raw 데이터의 결손 방지)

전사 단계에서 AI가 요약해 버리면, 깊은 분석에 필요한 "감정의 흔들림"이나 "사고의 비약" 같은 로우 데이터(Raw Data)가 손실됩니다. 요약이나 구조화는 후속 단계인 NotebookLM에서 수행하므로, 여기서는 "일절 가공하지 말 것"을 강제하고 있습니다.

시계열 순으로 출력 (정렬 버그(Sort Bug) 회피)

일주일 분량의 음성 파일을 한꺼번에 업로드하면, AI가 처리를 병렬화하는 영향인지 출력되는 일시의 순서가 엉망이 되는 경우가 있습니다. 시계열의 정확성은 로그 분석에 있어 생명이므로, 명시적으로 정렬(Sort)을 지시하고 있습니다.

확실한 파이프라인을 위한 "관심사의 분리(Separation of Concerns)"

이와 같이, 전사 페이즈에서는 "AI의 추론 능력을 의도적으로 제한하고, 충실한 텍스트 변환 장치로서만 기능하게 함"으로써, 후속 문서화 및 NotebookLM 저장이라는 데이터 파이프라인의 확실성을 담보하고 있습니다.

AI 시대의 데이터 보호 정책

다음에 정해야 할 것은 규칙입니다.

AI를 사용함으로써 잊어서는 안 되는 것이 "학습에 이용될 수 있다" ← 하고 있겠죠? (확정)

즉...

말하는 내용에서 반드시 지켜야 할 것으로서

・ 개인명은 말하지 않는다. (자신의 이름 포함)

・ 가게나 회사명도 숨긴다

・ 자신의 기분, 컨디션, 작품의 감상 (영화나 만화 등)

혼자 말하는 것이 "뇌의 캐시 클리어(Cache Clear)"를 일으키는 메커니즘

실제로 장점을 이야기해 나가기에 앞서, 최근까지는 "왜 효과가 있는지"를 이해하지 못한 채 완전히 **직관 (야생의 감)**만으로 운용해 왔습니다.

효과는 체감하고 있었지만, 막상 "왜 좋은 거야?"라는 질문을 받았을 때 "……왠지 우주와 연결된다고 해야 하나, 어쨌든 최고야! POWER!" 같은 이상한 답변밖에 할 수 없다는 사실을 깨달았습니다.

만약 이 "근거 찾기"와 "언어화"를 게을리하고 이 글을 공개했다면, 틀림없이 **『감정 과잉의 자기계발 포엠 (Poem)』**으로서 Zenn의 바다에 가라앉았을 것이고, 최악의 경우 직장에서 "저 사람한테 혹시 도자기 같은 거 사게 되는 거 아냐...?"라고 걱정받는 사람이 되었을 것이라고 확신합니다.

간신히 멈춰 서서, 어떻게든 여러분이 납득하실 수 있는 로직을 찾아왔기에 해설해 보겠습니다.

뇌의 메모리를 압박하는 "백그라운드 처리 (Background Processing)"

뇌는 해결되지 않은 태스크나 찝찝한 감정을 품고 있으면, 무의식중에 그것을 백그라운드에서 계속 처리하려고 합니다 (심리학에서는 자이가르니크 효과 (Zeigarnik effect)라고 불립니다). 이것이 뇌의 워킹 메모리 (Working Memory, RAM)를 압박하여, "왠지 모르게 피곤하다", "집중할 수 없다"와 같은 퍼포먼스 저하 (메모리 누수, Memory Leak)를 일으킵니다.

흔히 있는 "뒷이야기는 웹에서", "광고 후에"처럼 어중간하게 끝난 것이 신경 쓰이는 것도 그러한 심리 효과가 있었던 것인가... 하고, 유튜브 등에서도 초반에 하이라이트로 궁금증을 유발하는 컷을 넣는 것도 그런 이유 때문인가 하고 흥미롭게 보고 있습니다.

왜 "쓰는 것"이 아니라 "말하는 것"인가?

"글자를 쓰는 것", "텍스트를 타이핑하는 것"이라는 수법은 사실 뇌에 부하를 줍니다. 왜냐하면 문장을 쓰려고 하면 무의식적으로 "조사를 고치자", "논리적으로 구성하자"라는 "편집 프로세스 (Editing Process)"가 동시에 실행되어 사고와 편집의 멀티태스킹이 되어버리고, 뇌의 CPU를 불필요하게 소비하기 때문입니다.

반면, "녹음"이라는 행위는 머릿속에 떠오른 것을 그대로 스트리밍 출력하는 작업이므로 입력 지연 (Latency)이 거의 제로에 가깝습니다. 구조화나 문장화는 나중에 AI에게 통째로 맡길 수 있기 때문에 (관심사의 분리), 뇌에 부하를 주지 않고 최속으로 데이터를 출력할 수 있습니다.

멘탈의 러버덕 디버깅 (Rubber Duck Debugging)

이것은 근거를 찾다가 알게 된 것인데, 오리 인형에게 코드를 설명하다 보면 버그를 깨닫게 되는 "러버덕 디버깅 (Rubber Duck Debugging)"이라는 것이 있는 모양이더군요. 비엔지니어인 제 입장에서는 "하?" 싶었지만, 비슷하다고 느낄 만한 경험으로는 작년까지 연수 강사를 하면서 강의를 거듭하다 보니 자료나 지도 방식에서 위화감을 느껴 조금씩 수정해 나갔던 경험이 떠오릅니다...

스마트폰을 향해 지금의 상황이나 감정을 설명하다 보면, "어라, 별것도 아닌 일로 고민하고 있었네", "진짜 문제는 여기가 아니구나"라며 자기 자신의 인지 버그를 자동으로 깨달을 수 있습니다. 그 순간이라기보다는 다음 날 같은 때에 말이죠.

이렇게 생각하고 있는 것이나 미완성인 것들을 **"말하기"**으로써 하나하나 태스크 킬 (Task Kill)하고 있다고 하면 될까요? 완전히 끝낼 수 있는 것은 아니지만, 끝내려고 하는 의식은 사라지기 때문에 신경 쓰이지 않게 되었습니다.

뇌의 캐시 (Cache)를 상시 클리어하여 시스템을 안정 가동시키는 이 보이스 저널링의 최대 장점

1. 정상적인 판단 프로세스의 유지

생각할 여유가 있기 때문에, 돌발적인 에러나 트러블이 발생해도 패닉에 빠지거나 프리즈 (Freeze)되기 어렵습니다. 부감적인 시점으로 파악할 수 있기 때문에 잘못된 판단을 피할 수 있고, 객관적이고 정상적인 트러블슈팅 (Troubleshooting)이 가능해집니다.

체감상으로는 어떤 일이 일어나도 심박수가 잘 올라가지 않아서 냉정함을 유지할 수 있는 느낌입니다.

2. 의지력 (Willpower)의 온존과 "제2사분면"으로의 리소스 투자

항상 백그라운드 처리를 깨끗하게 유지함으로써 뇌의 "의지 배터리"의 불필요한 소비를 방지합니다. 리소스에 여유를 가짐으로써 일상적인 업무에 매몰되지 않고, 기술 학습이나 창의적인 취미 등 "긴급하지는 않지만 중요한 태스크 (제2사분면)"에 체력을 할당할 수 있습니다.

3. 스트레스에 대한 압도적인 내성

리소스에 여유가 있기 때문에 불합리한 트러블이나 인간관계의 스트레스와 같은 고부하가 걸려도 시스템이 크래시 (Crash)되지 않습니다.

오히려 여유 있는 뇌는 그러한 스트레스조차도 긍정적으로 처리하기 위해 머리가 돌아가며 더 높은 퍼포먼스를 끌어내는 느낌이 있습니다.

축적된 로그를 AI로 해석하기 (프롬프트의 "고통" 조절)

자, 여기까지는 구조나 메커니즘적인 이야기였습니다만, AI가 있는 시대이므로 해석하는 즐거움이 있지요. (스트레스 해소가 목적이라면 위 내용만으로도 충분합니다.)

드디어 NotebookLM의 차례입니다. Gemini의 채팅창 오른쪽에 있는 「+」 버튼을 통해 NotebookLM의 북(Book)을 지식으로 삼아 답변하게 함으로써, 저 자신을 완전히 드러내 보겠습니다.

실제로 사용하고 있는 프롬프트는 다음과 같습니다.

순한맛 (甘口)

다음의 저널링 로그를 읽어주세요.
먼저 오늘의 나의 노력과 감정을 철저하게 긍정하고 공감해 주세요.
그다음, 내일 마음이 조금이라도 가벼워질 수 있도록,
...

시작한 지 얼마 되지 않았을 때나 여력이 별로 없을 때, 혹은 예스맨(Yes-man)이면 충분하다고 생각하는 분들을 위한 설정입니다.

중간맛 (中辛)

다음 로그를 객관적·논리적으로 분석해 주세요.
내가 현재 안고 있는 「노이즈 (불필요한 스트레스)」와 「집중해야 할 과제」를 분류하고,
내일 실행해야 할 액션 플랜 (Action Plan)을 우선순위에 따라 3가지 불렛 포인트로 출력해 주세요.
...

객관화와 액션 플랜이 필요한 분들을 위한 설정입니다.

매운맛 (辛口)

다음 로그를 읽고, 내 사고의 「버그 (인지 왜곡, 고정관념, 변명)」를
가차 없이 지적해 주세요.
내가 무의식적으로 피하고 있는 근본적인 문제는 무엇인가
...

이것은 여유가 있을 때 하세요! 가벼운 마음으로 시도했다가는 정신력이 상당히 소모되므로, 심신이 모두 건강할 때 해야 합니다. 상태에 따라서는 오버킬 (Overkill)이 될 수도 있습니다.

하지만 익숙해지면 매운맛이 딱 적당할 때가 있습니다. 어느 정도 자신에 대해 파악하고 있으면 재인식(내가 잘 못하는 것이나 무의식적으로 피하고 있는 것 등)을 할 수 있기 때문입니다. 순한맛이나 중간맛으로 전적으로 긍정받는 것도 중요하지만, "앗, 위험해. 방금 혹시 (사이비) 항아리라도 팔 뻔했나?", "최근 발언이 너무 감성적(Poem)이야", "감정이 너무 격해지고 있어" 같은 상황일 때는 매운맛으로 교정받도록 합시다.

마치며

「블로그 소재 찾기」라는 불순한 동기와 「글자를 치는 것이 귀찮다」라는 나태함에서 시작된 AI 보이스 저널링.

하지만 막상 뚜껑을 열어보니, 뇌의 캐시 클리어 (Cache Clear)와 「NotebookLM을 이용한 로그의 객관적 해석」이라는 최강의 자기 관리 (Self-maintenance) 시스템이 완성되어 있었습니다.

만약 당신이 지금 미결된 태스크나 불합리한 에러 대응으로 인해 「뇌의 메모리가 압박받고 있다」고 느낀다면, 밑져야 본전이라는 생각으로 퇴근길에 스마트폰을 향해 오늘 느꼈던 답답함을 중얼중얼 이야기해 보세요.

채용 정보

메디롬 (Medilom) 그룹에서는 다음과 같은 서비스를 전개하고 있습니다.

전국 300개 이상의 점포를 보유한 릴랙세이션 스튜디오 「Re.Ra.Ku」

세계 최초! 충전이 필요 없는 활동량계 「MOTHER bracelet」

헬스케어 코칭 앱 「Lav」

헬스케어 영역에 관심이 있는 엔지니어, PM, 정보시스템(情シス) 담당자를 절찬 모집 중입니다!

조금이라도 관심이 생기셨다면, 꼭 아래 링크를 통해 지원해 주세요.

함께 새로운 헬스케어 서비스를 만들어 갑시다 🌟