방어적 보고를 넘어: 보험 분야의 능동적 자금 세탁 방지 통제를 위한 머신러닝 (Machine Learning)
요약
보험 청구를 통한 자금 세탁을 예방하기 위해 머신러닝을 활용하는 방안을 다룬 첫 번째 실증 연구입니다. 그래디언트 부스팅 결정 트리 모델을 사용하여 의심스러운 청구를 사전에 식별하고, 사기 레이블을 보조 신호로 활용하는 방법론을 제시합니다.
핵심 포인트
- 보험 청구 기반 자금 세탁 탐지를 위한 머신러닝 모델 연구
- Gradient-boosted decision tree 모델 활용
- 보험 사기 레이블을 보조 학습 신호로 통합하여 성능 향상
- 예산 가중 포착률(Budget-Weighted Capture Rate) 지표 도입
- 상위 2~6% 조사 범위 내에서 세탁 사례의 약 2/3 포착
보험 청구를 통한 자금 세탁 (Money laundering)은 사기성 지급뿐만 아니라 평판 및 규제 리스크를 통해 보험사 모두에게 위협이 됩니다. 그럼에도 불구하고, 이러한 세탁 행위를 어떻게 예방할 수 있는지에 대한 연구는 거의 이루어지지 않았습니다. 본 논문은 머신러닝 (Machine learning)이 보험사가 지급 전에 의심스러운 청구를 식별하도록 도와, 초점을 수동적 보고에서 능동적 예방으로 전환할 수 있는지 조사합니다. 노르웨이의 주요 보험사에서 얻은 실제 데이터를 사용하여, 우리는 추후 자금 세탁 의심으로 당국에 보고된 청구 건들을 탐지하기 위해 그래디언트 부스팅 결정 트리 (Gradient-boosted decision tree) 모델을 학습시킵니다. 사기 (Fraud)와 세탁은 행동 패턴을 공유할 수 있기 때문에, 우리는 보험 사기 레이블 (Fraud labels)이 보조적인 학습 신호 (Auxiliary training signal)로 기능할 수 있는지도 검토합니다. 우리는 소수의 청구 건만 수동으로 검토할 수 있을 때 얼마나 많은 세탁 사례를 포착할 수 있는지를 측정하기 위해 본 논문에서 도입한 지표인 예산 가중 포착률 (Budget-Weighted Capture Rate)을 사용하여 다양한 학습 설정을 비교합니다. 결과에 따르면, 사기 관련 조사 레이블을 통합하는 것이 세탁 탐지 성능을 실질적으로 향상시키는 것으로 나타났습니다. 가장 성능이 좋은 모델은 조사를 위해 선택된 상위 2~6%의 청구 건 내에서 세탁 사례의 거의 3분의 2를 포착합니다. 우리가 알기로, 이는 보험 청구 내 자금 세탁 탐지를 위한 머신러닝 (Machine learning)에 관한 첫 번째 실증적 연구입니다.
AI 자동 생성 콘텐츠
본 콘텐츠는 arXiv cs.LG의 원문을 AI가 자동으로 요약·번역·분석한 것입니다. 원 저작권은 원저작자에게 있으며, 정확한 내용은 반드시 원문을 확인해 주세요.
원문 바로가기