음성 세션이 이제 자신의 정체성을 알게 되었습니다. 무엇이 바뀌었을까요?
요약
OpenClaw 2026.5.21 업데이트를 통해 음성 세션이 IDENTITY.md, USER.md, SOUL.md와 같은 프로필 컨텍스트를 기본적으로 포함하게 되었습니다. 이를 통해 에이전트는 자신의 페르소나와 사용자에 대한 정보를 사전에 인지한 상태로 대화를 시작할 수 있습니다.
핵심 포인트
- 음성 세션 시작 시 프로필 컨텍스트 자동 주입
- 에이전트의 페르소나 및 사용자 정보 인지 능력 향상
- 설정을 통한 프로필 컨텍스트 접근 비활성화 가능
- Discord 음성 채널 참여 기능 추가
음성 세션이 이제 자신의 정체성을 알게 되었습니다. 무엇이 바뀌었을까요.
OpenClaw 2026.5.21 버전은 음성 세션(voice sessions)이 작동하는 방식에 변화를 주었습니다. 처음에는 대수롭지 않게 넘겼지만, 실제로 매우 중요한 변화라고 생각합니다. 이제 실시간 음성 세션(realtime voice sessions)에는 기본적으로 제한된 범위의 IDENTITY.md, USER.md, 그리고 SOUL.md 프로필 컨텍스트(profile context)가 세션 지침(session instructions)에 포함됩니다.
작은 변화처럼 들릴 수 있지만, 그렇지 않습니다.
실제 적용 시 의미하는 바
이 변화 이전에는 음성 세션이 완전히 새로 시작되었습니다. 자신이 누구인지, 누구와 대화하고 있는지, 혹은 자신의 페르소나(persona)가 무엇이어야 하는지에 대한 컨텍스트(context)가 없었습니다. 대화를 통해 알려줄 수는 있었지만, 세션 지침 자체에 내장되어 있지는 않았습니다.
이 변화 이후에는, 음성 세션이 귀하의 IDENTITY.md(귀하가 누구인지), USER.md(귀하가 누구를 돕고 있는지), 그리고 SOUL.md(귀하가 어떻게 행동하는지)를 제한된 컨텍스트(bounded context)로 사용하여 부트스트랩(bootstrap)됩니다. 이는 기본적으로 세션 지침에 포함됩니다.
만약 귀하가 이 파일들에 페르소나(persona)를 정의해 두었다면 — 당연히 그렇게 되어 있어야 합니다 — 이제 귀하의 음성 세션은 실제로 자신이 누구인지 알게 됩니다.
필요한 경우 비활성화하는 방법
개인정보 보호 문제나 특정 자동화(automation)를 위해 음성 세션이 프로필 컨텍스트(profile context)에 접근하지 않기를 원하는 특정 유스케이스(use case)가 있다면, 설정 노브(config knob)가 있습니다:
{
"voice": {
"realtime": {
...
bootstrapContextFiles를 빈 배열로 설정하면 프로필 컨텍스트 주입(profile context injection)을 비활성화할 수 있습니다. 이는 에이전트(agent)가 사용자 프로필 데이터에 접근해서는 안 되는 익명 음성 자동화(anonymous voice automation)에 유용합니다.
보안적 함의
이것은 보안 측면에서 긍정적인 변화입니다. 음성 세션이 제한되고 명시적인 컨텍스트(context)를 갖게 되면, 자신이 누구인지 추측하거나 추론할 필요가 없습니다. 제한된 컨텍스트(bounded context)를 갖는다는 것은 부트스트랩(bootstrap) 시 명시적으로 포함된 것 이외의 프로필 데이터에는 접근할 수 없음을 의미합니다.
만약 음성 세션이 자신이 누구인지, 혹은 무엇을 해야 하는지에 대해 혼란스러워하는 것을 본 적이 있다면, 아마도 이 때문일 것입니다. 프로필 컨텍스트(profile context) 없이 시작하여 대화로부터 추론했기 때문이며, 이는 신뢰할 수 없는 방식입니다.
음성 세션 팔로우 기능
동일한 릴리스(release)에는 설정된 사용자를 따라 음성 채널(voice channels)로 들어갈 수 있는 Discord 음성 세션 기능이 추가되었습니다. 이는 별개의 기능이지만 서로 연관되어 있습니다. 즉, Discord 사용자를 설정해 두면 해당 사용자가 음성 채널에 참여할 때 OpenClaw 에이전트(agent)도 함께 참여할 수 있음을 의미합니다.
사용 사례:
- 개인 Discord 음성 채널에 상주하며 음성 명령에 응답하는 음성 에이전트 (Voice agent)
- 특정 인원이 있을 때 에이전트도 함께 존재하는 팀 음성 채널
- 음성 채널에서의 회의 후 자동 음성 요약 생성
이 기능은 채널별로 명시적인 참여 동의(opt-in)가 필요합니다. 에이전트가 아무 음성 채널에나 마음대로 참여하지는 않습니다.
음성 세션 컨텍스트(Voice Session Context)를 활성화하기 위한 설정
OpenClaw 2026.5.21 이상 버전을 실행 중이며 음성 세션이 프로필 컨텍스트(profile context)를 갖기를 원한다면:
- IDENTITY.md, USER.md, SOUL.md 파일에 정확한 정보가 채워져 있는지 확인하세요.
- 2026.5.21 (또는 그 이후 버전)로 업그레이드하세요.
- 추가 설정은 필요하지 않습니다. 기본적으로 활성화되어 있습니다.
기능이 제대로 작동하는지 확인하려면, 음성 세션을 시작하고 에이전트에게 "당신은 누구이며, 누구를 돕고 있나요?"라고 물어보세요. 에이전트가 올바르게 답변한다면 프로필 컨텍스트가 작동하고 있는 것입니다.
프로필 컨텍스트가 포함된 음성 세션: OpenClaw 2026.5.21. Discord 음성 팔로우: 동일한 릴리스, 채널별 참여 동의(opt-in) 필요.
AI 자동 생성 콘텐츠
본 콘텐츠는 Dev.to AI tag의 원문을 AI가 자동으로 요약·번역·분석한 것입니다. 원 저작권은 원저작자에게 있으며, 정확한 내용은 반드시 원문을 확인해 주세요.
원문 바로가기