Show GN: AI한테 메일 맡기지 마라 — 인박스엔 비서가 아니라 '방화벽'이 필요하다 (오픈소스)
요약
AI가 메일을 대신 작성하는 대신, 들어오는 메일을 분류하고 필터링하는 '방화벽' 역할을 하는 오픈소스 프로젝트 Klorn을 소개합니다. LLM은 결정이 아닌 점수 산출에만 활용하며, 결정론적 규칙과 데이터 무결성 검증을 통해 안전성을 확보합니다.
핵심 포인트
- LLM은 메일의 확신도, 신뢰도 등을 점수화하는 역할만 수행
- 전송·삭제 등 되돌릴 수 없는 작업은 결정론적 검증(Deterministic Floor) 적용
- 고성능 모델보다 일관성 있는 저비용 모델이 분류 작업에 더 효율적
- Ollama를 통한 로컬 LLM 활용으로 데이터 보안 강화
- AGPLv3 라이선스의 오픈소스 프로젝트
요즘 "AI 이메일" 도구는 전부 같은 방향입니다. 메일마다 초안 깔고, "AI가 답장하래요" 배지 붙이고, 자동 전송 버튼 답니다. 결과는? 인박스가 조용해지는 게 아니라 더 시끄러워집니다. 화면 위에 화면을 또 얹는 거예요.
저는 정반대로 만들었습니다. AI한테 인박스를 맡기는 게 아니라, AI를 막는 방화벽. Klorn은 들어오는 메일마다 분류 딱 하나만 내보내고 나머지는 안 보여줍니다.
4단계 — SILENT(기록만, 안 보임) / QUEUE(큐에 보임, 알림 없음) / PUSH(진짜 깨움) / AUTO(지금은 분류만, 실행은 의도적으로 미연결).
핵심 — LLM은 결정을 안 합니다. 메일마다 4개 숫자(확신도·발신자 신뢰·되돌릴 수 있음·긴급도)만 점수 매기고, 사람이 읽을 수 있는 결정론적 규칙이 그걸 단계로 매핑합니다. 그래서 모델 없이도 정책을 감사·테스트할 수 있고, LLM이 죽어도 키워드 fallback이 같은 숫자를 만들어 긴급 메일은 통과시킵니다.
그리고 되돌릴 수 없는 건 AI한테 절대 안 맡깁니다. 전송·영구삭제·외부전달 3개는 deterministic floor 뒤에 — 승인 시점에 보낼 바이트를 receipt로 고정하고, 실행 때 한 바이트라도 다르면 throw. 자율 경로는 fail-closed. AI가 "보냈어요"라고 우겨도 바이트가 안 맞으면 안 나갑니다.
"AI는 마법" 부분도 직접 측정했습니다. 분류 작업에선 GPT-4o보다 훨씬 싼 모델이 더 정확했어요. 이런 일엔 천재 모델이 아니라 4개 신호를 매번 똑같이 읽는 일관성이 필요합니다 (수치·근거는 아래 글).
AGPLv3 오픈소스, OpenAI 호환 엔드포인트면 다 붙습니다(Ollama로 메일이 내 머신 밖으로 안 나감). 솔직히 초기 PoC — 제 실제 메일 50개에 약 80% 일치(1회, 제가 건 기준선), 실유저는 아직 저 하나, AUTO 실행은 일부러 꺼둠. 과장하면 첫 댓글이 물어뜯으니까요.
설계 글 (엔지니어들 아키텍처 토론 붙은 시리즈):
싼 모델이 GPT-4o 이긴 이유: https://dev.to/k08200/…
LLM이 점수만 매기고 결정은 안 하는 이유: https://dev.to/k08200/…
되돌릴 수 없는 액션의 deterministic floor: https://dev.to/k08200/…
레포: https://github.com/k08200/klorn (docker-compose + 로컬 LLM 셋업). 데모는 OAuth 테스팅 모드(100명)라 self-host가 가장 빠름.
AI 자동 생성 콘텐츠
본 콘텐츠는 GeekNews의 원문을 AI가 자동으로 요약·번역·분석한 것입니다. 원 저작권은 원저작자에게 있으며, 정확한 내용은 반드시 원문을 확인해 주세요.
원문 바로가기