arXiv논문2026. 06. 15. 11:42

DIFF-ERO: 프로세스 마이닝(Process Mining)의 딥러닝을 위한 적합성 인지 손실 함수

요약

프로세스 마이닝의 딥러닝 모델을 위해 제어 흐름 구조를 반영하는 새로운 손실 함수 DIFF-ERO를 제안합니다. 기존 교차 엔트로피 방식의 한계를 극복하여 전역적 동작의 정확도를 높이고 구조적 정밀도와 재현율을 개선합니다.

핵심 포인트

표준 교차 엔트로피의 국소적 최적화 한계 해결
엔트로피 기반 확률적 적합성을 활용한 미분 가능한 손실 함수 제안
모델 불가지론적(model-agnostic) 설계로 다양한 파이프라인 적용 가능
트랜스포머 기반 모델에서 구조적 정밀도 및 예측 성능 향상 입증

딥러닝(Deep learning)은 최근 프로세스 분석(process analytics), 특히 예측적(predictive) 및 처방적(prescriptive) 모니터링 분야에서 많은 발전을 이끌어냈습니다. 그러나 교차 엔트로피(cross-entropy)와 같은 표준 목적 함수(standard objectives)는 국소적인 다음 단계 가능도(local next-step likelihoods)를 최적화하며, 제어 흐름(control-flow) 구조를 암묵적으로만 포착합니다. 그 결과, 모델은 토큰 수준의 정확도(token-level accuracy)는 높게 달성할 수 있지만, 부정확한 전역적 동작(global behaviour)을 허용할 수 있습니다. 우리는 프로세스 데이터에 대한 딥러닝 모델을 위한 적합성 인지(conformance-aware) 손실 함수인 DIFF-ERO를 소개합니다. DIFF-ERO는 훈련 과정에서 제어 흐름 정보를 통합하는 엔트로피 기반 확률적 적합성(entropy-based stochastic conformance)의 미분 가능한 공식화(differentiable formulation)입니다. 우리의 접근 방식은 소프트 엣지 멤버십(soft edge memberships)을 가진 배치 수준의 확률적 전이 행렬(batch-level stochastic transition matrices)을 구축하여, 구조적 정밀도(precision) 및 재현율(recall) 신호가 역전파(backpropagation)에 직접적으로 정보를 제공할 수 있도록 합니다. 이 손실 함수는 모델 불가지론적(model-agnostic)이며, 최종 표현(final representation)이 확률적 전이(stochastic transitions)를 매개변수화할 때마다 적용될 수 있습니다. 우리는 다음 활동 예측(next-activity prediction)을 위한 트랜스포머 인코더-디코더(transformer encoder-decoder) 파이프라인에서 DIFF-ERO를 구현하였으며, 수렴(convergence)과 관련하여 이론적 구성 요소를 분석하기 위해 이를 교차 엔트로피와 공동으로 사용했습니다. 다른 손실 함수 및 타겟들과 비교한 벤치마크 전반에서, DIFF-ERO는 다른 곳에서는 대등한 성능을 유지하면서도 구조가 가장 중요한 지점에서 향상된 예측 성능을 보여줍니다. 동시에, 학습된 확률적 오토마톤(stochastic automaton)은 구조적 정답(structural ground truth)을 향해 수렴하며, 이는 네트워크가 프로세스 모델 구조를 내재화하고 있음을 나타냅니다.

AI 자동 생성 콘텐츠

원문 바로가기

DIFF-ERO: 프로세스 마이닝(Process Mining)의 딥러닝을 위한 적합성 인지 손실 함수

요약

핵심 포인트

댓글