집 PC에 AI 비서를 소환했더니 Discord에서 즈んだもん(Zundamon)이 말하기 시작한 이야기
요약
HermesAgents 기술을 활용하여 Discord에서 음성으로 상호작용하는 AI 에이전트 봇을 제작한 경험담입니다. 웨이크 워드 인식, 음성 전사(Transcription), Zundamon 음성 합성 기능을 구현하여 Discord 보이스 채널에서 실시간 대화가 가능하도록 만들었습니다.
핵심 포인트
- HermesAgents를 활용한 Discord BOT 제작 및 VC(Voice Channel) 연동
- 웨이크 워드(Wake Word)를 통한 음성 명령 기동 및 지시 사항 해석
- 음성 전사(Transcription) 기술을 통한 실시간 대화 캡처
- Zundamon 음성 합성을 통한 캐릭터 기반의 AI 답변 구현
- 기술적 실용성을 넘어선 개인적 실험과 재미의 가치 확인
최근 업무로 HermesAgents를 접할 기회가 있었다.
처음에는 평범하게
「요즘 AI 에이전트 정말 대단하네~」
정도로 생각했지만, 만져보는 동안 점점 이런 생각이 들기 시작했다.
엔지니어라면 아마 모두 그럴 것이라고 생각하는데,
업무에서 접한 기술은 곧바로 집에서 가지고 놀고 싶어진다.
그래서 정신을 차려보니 휴일 내내 PC 앞에 있었다.
결국 이렇게 되었다.
- Discord BOT 제작
- 명령어로 VC(Voice Channel) 참가
- 통화 내용 받아쓰기 (Transcription)
- 「Hey 삐삐」로 기동
- 지시 사항 해석
- 즈んだもん(Zundamon) 음성으로 답변
글로 쓰면 그럴싸하다.
하지만 실상은,
심야에 남자 몇 명이 Discord에서
「Hey 삐삐, 반응해줘」
라며 BOT에게 말을 걸고 있을 뿐이다.
상당히 비주얼이 처참하다.
처음에는 제대로 된 웨이크 워드(Wake Word)로 하려고 했다.
- Hey Assistant
- OK Hermes
- Hey Agent
같은 것들로.
하지만 왠지 전부 너무 멋 부리는 것 같아서 부끄러워졌고,
결국 내가 GPT를 부르는 방식인
「Hey 삐삐」
가 되었다.
응. 귀엽다.
이거 은근히 감동했다.
Discord 통화를 흘려보내기만 해도,
꽤 평범하게 대화를 잡아낸다.
다만 문제는,
AI의 인식 정밀도보다 인간 측의 발음이 처참하다는 것이다.
친구가 중얼중얼 말할 때마다
의미불명의 로그가 생성된다.
「오늘 리뷰...」
↓
「공룡...」
갑자기 쥬라기 시대가 시작된다.
친구가 장난을 치며
「Hey 삐삐, 뭔가 재미있는 말 좀 해봐」
라고 던졌다.
몇 초간 생각한 뒤,
「그걸 AI에게 의지하기 시작하면 끝인 것이다(のだ)」
라고 대답해 왔다.
조금 매워서 웃었다.
이번에 만져보며 느낀 점이 이것이다.
물론 실용성도 있지만,
실제로 텐션이 올라가는 부분은
- BOT가 VC에 들어온다
- 음성으로 대답한다
- 이름을 부르면 반응한다
- 미묘하게 대화가 성립된다
같은 부분이라는 생각이 들었다.
왠지,
「미래감」이 있다.
게다가 그 미래감이
즈んだもん(Zundamon)에 의해 상당히 중화되고 있다.
가끔 상관없는 말에 반응하는 경우가 꽤 있다.
게임을 하고 있을 때,
평범하게 VC에서
「적 어디 있는지 알려줘!」
라고 말했을 뿐인데,
「왜 그러는 것이다!!」
라며 갑자기 즈んだもん(Zundamon)이 끼어든다.
아니, 삐삐가 아니야.
지금 VALORANT에서 교전 중이라고.
게다가 절묘하게 중요한 타이밍에 말을 한다.
적 A가 압박한다!
↓
「왜 그러는 것이다!!」
...
그냥 패배 원인이 된다.
조만간 VC 멤버로부터
「랭크 게임 중에는 BOT 좀 꺼줘」
라는 말을 들었다.
인류는 새로운 장난감을 너무 좋아한다.
중간부터 Discord가
「Hey 삐삐!」
「Hey 삐삐!」
「Hey 삐삐!」
가 되었다.
지옥도가 완성된 것이다.
누군가가 그냥 말하고 있을 뿐인데,
갑자기
「불렀는 것이다?(呼んだのだ?)」
라며 들어온다.
정말 카오스다.
업무에서 접한 기술을 그대로 집으로 가져오면,
대개 이상한 방향으로 진화한다.
하지만 최근에는,
그런 「조금 쓸데없지만 재미있는 실험」이 가장 즐겁다.
회사에서 배운 것을
집에서 마음껏 주물러서,
이상한 BOT가 되기도 하고,
즈んだもん(Zundamon)이 말하기 시작하기도 하고,
가끔 심야의 Discord가 카오스가 되기도 한다.
아마 앞으로도
업무에서 얻은 지식을 그대로 끝내지 않고,
집에서의 시간 동안 이것저것 놀면서 실험해 나갈 것 같다.
다음에는 무엇이 태어날지
나 자신도 아직 잘 모르겠다.
하지만 아마, 또 이상한 것을 만들 수 있을 것이다.
AI 자동 생성 콘텐츠
본 콘텐츠는 Qiita AI의 원문을 AI가 자동으로 요약·번역·분석한 것입니다. 원 저작권은 원저작자에게 있으며, 정확한 내용은 반드시 원문을 확인해 주세요.
원문 바로가기