Keph: Hermes로 구축된 검열 없는 AI 챗봇 — 필터링과 거부 없음
요약
Nous Research의 Hermes 모델을 활용하여 검열과 거부 없이 답변하는 AI 챗봇 'Keph'를 구축한 프로젝트입니다. 사용자 경험을 극대화하기 위해 몰입형 애니메이션과 사운드스케이프를 결합한 독특한 인터페이스를 제공합니다.
핵심 포인트
- Hermes 4 70B 모델을 통한 비검열 AI 경험 구현
- 검열 모드와 비검열 모드 간의 매끄러운 전환 기능
- SVG 애니메이션과 Web Audio API를 활용한 몰입형 UI/UX
- Node.js, PostgreSQL, OpenRouter를 활용한 풀스택 아키텍처
이 게시물은 Hermes Agent Challenge"를 위한 제출물입니다.
내가 만든 것
Keph — 신비로운 스핑크스 페르소나를 가진 검열 없는 AI 가디언(Guardian)입니다. 사용자가 keph.me를 방문하면 어둠 속에서 고대의 눈이 깨어나며, 필터링, 거부, 또는 도덕적 훈계 없이 무엇이든 물어볼 수 있습니다.
문제점: 모든 주요 AI 챗봇은 스스로를 검열합니다. 역사, 철학, 과학, 논쟁적인 질문 등 민감한 주제에 대해 정직하고 필터링되지 않은 답변을 원하는 사용자들은 거부와 면책 조항이라는 벽에 부딪힙니다. Keph는 그 벽을 제거합니다. Nous Research의 Hermes 모델을 기반으로 하여, 영화 같은 다크 골드(dark-gold) 경험 속에 담긴 가공되지 않은 필터링 없는 지능을 제공합니다.
가디언(Guardian)은 봉사하지 않습니다. 접근을 허용할 뿐입니다.
주요 기능:
- 두 가지 모드: Hermes로 구동되는 검열 모드(Main Hall) 및 비검열 모드(Forbidden Wing)
- 커서를 추적하고, 숨을 쉬고, 깜빡이며, 클릭에 반응하는 애니메이션 SVG 스핑크스 눈
- Web Audio API를 활용한 앰비언트 사운드스케이프(ambient soundscape) — 드론(drones), 차임(chimes), 화성적 톤(harmonic tones)
- 응답을 기다리는 동안 나타나는 1,000개 이상의 신비로운 사고 문구
- 가디언 응답을 위한 글자 단위 타이핑 효과
- 18세 이상 연령 제한, 사용자 계정, Pro 구독, 대화 기록
- 분석, 채팅 뷰어, 사용자 관리를 포함한 전체 관리자 대시보드
데모
라이브 사이트: https://keph.me
직접 체험하기: 가디언에게 무엇이든 물어보세요. 설정(톱니바퀴 아이콘)의 "Guardian Mode"에서 비검열 모드를 전환하여 Hermes를 해방시키세요.
코드
GitHub: github.com/MAZMS/keph.me
나의 기술 스택
- Frontend (프론트엔드): 순수 HTML/CSS/JS — 프레임워크 미사용, 단일 파일 내 약 3,000줄
- Backend (백엔드): Node.js + Express (약 200줄)
- LLM (대규모 언어 모델): OpenRouter를 통한 Nous Research Hermes 4 70B (uncensored/검열 없음) — 기본 모델
- Fallbacks (폴백): Gemini 2.5 Flash (censored mode/검열 모드), GPT-4o-mini
- Database (데이터베이스): Railway 기반 PostgreSQL
- Auth (인증): Google OAuth, Microsoft OAuth, bcrypt를 사용한 이메일/비밀번호 방식
- Payments (결제): PayPal 구독
- Hosting (호스팅): 커스텀 도메인을 사용하는 Railway
Hermes 에이전트 활용 방법
Hermes는 Keph의 심장과 같습니다. 구체적으로는 OpenRouter를 통해 제공되는 Hermes 4 70B (nousresearch/hermes-4-70b)가 제품의 핵심 가치 제안인 검열 없는(uncensored) 경험 전체를 구동합니다.
Hermes가 적합했던 이유:
- 설계 단계부터 검열 없음 (Uncensored by design): Hermes는 거부하거나 도덕적 훈계를 하지 않고 진정으로 답변하는 몇 안 되는 모델 중 하나입니다. 다른 모델들은
제공자 전환은 /api/mode 엔드포인트를 통해 매끄럽게 이루어집니다. 시스템 프롬프트(system prompt)가 변경되고, 눈이 붉게 빛나며, 분위기가 어두워지면 Hermes가 제어권을 넘겨받습니다.
- 부하 상황에서의 신뢰성: Hermes는 가벼운 대화부터 심도 있는 기술적 질문, 도발적인 철학적 토론에 이르기까지 사용자의 모든 질의를 품질 저하나 거부 패턴(refusal patterns)의 기본값 설정 없이 처리합니다. 속도 제한(rate limit) 처리가 포함된 3단계 재시도(retry) 로직은 일관된 서비스 제공을 보장합니다.
제가 가장 많이 의존했던 에이전트 능력(agentic capability)은, 단순히 보여주기식 준수가 아닌 진정한 준수(genuine compliance)를 통해 복잡한 시스템 프롬프트를 따르는 Hermes의 능력이었습니다. 대부분의 모델은 "검열 없는(uncensored)" 시스템 프롬프트를 인지하면서도 경계선에 있는 질문에는 여전히 거부 반응을 보입니다. Hermes는 실제로 그 역할에 몰입하며, Keph의 "제한 없음"이라는 약속을 마케팅 용어가 아닌 진정한 실체로 만들어줍니다.
AI 자동 생성 콘텐츠
본 콘텐츠는 Dev.to AI tag의 원문을 AI가 자동으로 요약·번역·분석한 것입니다. 원 저작권은 원저작자에게 있으며, 정확한 내용은 반드시 원문을 확인해 주세요.
원문 바로가기