대화에서 탐지로: 보험 사기 탐지를 위한 멀티모달 하이브리드 NLP 파이프라인
요약
보험 사기 탐지를 위해 텍스트와 오디오를 결합한 멀티모달 하이브리드 NLP 파이프라인을 제안합니다. 합성 데이터 프레임워크를 통해 대화 전사본과 화자 오디오를 생성하고, LLM-RAG 및 화자 임베딩을 활용하여 사기 징후를 식별합니다.
핵심 포인트
- 멀티모달 프레임워크를 통한 합성 데이터 생성 및 검증
- ASR, 화자 분리, NER 및 LLM-RAG 기술 통합
- 서사 재사용 및 구조적 불일치 식별을 통한 사기 탐지
- 텍스트 전용 모델 대비 높은 안정성과 전이 가능성 확보
보험 사기는 상당한 재정적 손실과 운영 비효율성을 초래하며, 보험료를 인상시키고 정당한 보험 가입자들 사이의 신뢰에 영향을 미칩니다. 사고 접수(FNOL, First Notice of Loss) 단계에서의 조기 탐지는 여전히 지속적인 과제로 남아 있습니다. 기존의 접근 방식은 주로 비공개된 텍스트 전용 데이터셋에 의존하고 있어, 언어적, 행동적, 화자 기반 지표를 통합하는 멀티모달 (Multimodal) 방식의 발전이 제한적이었습니다. 본 연구에서는 FNOL 조건을 재현하는 합성 멀티모달 프레임워크를 소개합니다. 이 프레임워크는 상담원-고객 간의 대화 전사본(transcripts)과 2인 화자 오디오를 생성하며, 자동 음성 인식 (ASR, Automatic Speech Recognition) 및 화자 분리 (Diarisation)를 수행합니다. 다운스트림 (Downstream) 모듈은 개체명 인식 (NER, Named Entity Recognition), 정규 표현식 (Regex) 기반 특징 추출, LLM-RAG 검색, 그리고 화자 임베딩 (Speaker Embeddings)을 규칙 기반 위험 점수 (Rule-based risk score)로 결합하여, 민감도와 오탐 (False Positives) 사이의 균형을 맞추면서 서사 재사용, 구조적 불일치, 그리고 사례 간 음성 반복을 식별합니다. 데이터셋 검증 및 구성 요소별 평가 결과, 안정성과 전이 가능성을 보여주었으며, 텍스트 전용 사기 탐지를 넘어 재현 가능한 베이스라인 (Baseline)을 제공합니다.
AI 자동 생성 콘텐츠
본 콘텐츠는 arXiv cs.CL (NLP)의 원문을 AI가 자동으로 요약·번역·분석한 것입니다. 원 저작권은 원저작자에게 있으며, 정확한 내용은 반드시 원문을 확인해 주세요.
원문 바로가기