arXiv논문2026. 05. 27. 11:33

데이터 민감 도메인을 위한 LLM 출력의 신경-기호적 검증 (Neuro-Symbolic Verification) (확장된 프리프린트)

요약

데이터 민감 도메인에서 LLM의 환각과 보안 문제를 해결하기 위해 신경망과 기호적 방법론을 결합한 하이브리드 검증 아키텍처를 제안합니다. 논리적 추론과 임베딩 기반 유사성 분석을 병렬로 수행하여 기존 프롬프트 기반 검증의 한계를 극복합니다.

핵심 포인트

신경-기호적 결합을 통한 하이브리드 검증 아키텍처 제시
구조화된 엔티티 환각 83%, 의미적 조작 72% 탐지율 달성
의료 기기 평가 시스템 HAIMEDA를 통한 실증적 검증 완료
보고서 작성 시간 30% 단축 및 신뢰성 있는 안전장치 제공

높은 이해관계가 걸린(high-stakes) 도메인에 배포된 LLM(Large Language Models)은 근본적인 신뢰성 문제에 직면해 있습니다. 환각(hallucinations), 불일치(inconsistencies), 그리고 개인정보 취약성(privacy vulnerabilities)은 오류가 법적, 재정적 또는 안전상의 결과를 초래하는 상황에서 수용 불가능한 위험을 유발합니다. 본 논문은 LLM이 생성한 콘텐츠에 대해 상호 보완적인 보증을 제공하기 위해, 형식적 기호 방법론(formal symbolic methods)과 신경망 의미론적 분석(neural semantic analysis)을 결합한 하이브리드 검증 아키텍처를 제시합니다. 이 아키텍처는 입력 검증을 위해 논리적 추론(logical reasoning)을 채택하며, 완전성 속성(completeness properties)을 활용하여 구조화된 요구사항에 대해 결정 가능한(decidable) 보증을 제공합니다. 출력 검증의 경우, 형식적 방법론이 표현력(expressiveness)이 부족한 맥락적 환각(contextual hallucinations)을 탐지하기 위해 임베딩 기반의 의미적 유사성(embedding-based semantic similarity)을 사용합니다. 이러한 분리는 병렬적인 액터 기반 파이프라인(actor-based pipeline)에서 구현되며, 이는 환각을 유발하는 분포 편향(distributional biases)을 상속받는 프롬프트 기반 자기 검증(prompt-based self-verification) 방식의 한계를 해결합니다. 제안된 아키텍처와 타입 인식 검증 방법(type-aware verification method)은 액션 디자인 연구(Action Design Research)를 통해 개발된 실제 의료 기기 손상 평가 보고 시스템인 HAIMEDA를 통해 검증되었습니다. 평가 결과, 구조화된 엔티티(structured entities)에 대해 83% 이상, 의미적 조작(semantic fabrications)에 대해 72%의 환각 탐지율을 보였으며, 보고서 작성 시간은 30% 단축되었습니다. 이는 신경-기호적 아키텍처(neuro-symbolic architectures)가 데이터 민감 도메인에서의 LLM 배포를 위한 원칙적인 안전장치(principled safeguards)를 제공할 수 있음을 입증합니다.

AI 자동 생성 콘텐츠

원문 바로가기

데이터 민감 도메인을 위한 LLM 출력의 신경-기호적 검증 (Neuro-Symbolic Verification) (확장된 프리프린트)

요약

핵심 포인트

댓글