Seahorse: 시공간 이벤트 모델링을 위한 통합 벤치마킹 프레임워크
요약
시공간 점 프로세스(STPPs) 모델들의 공정한 비교를 위해 설계된 통합 벤치마킹 프레임워크 SEAHORSE를 제안합니다. 이 프레임워크는 통일된 인터페이스와 프로토콜을 통해 다양한 신경망 기반 모델의 훈련 및 평가를 지원하며, 모델 간의 성능 차이와 귀납적 편향을 분석할 수 있게 합니다.
핵심 포인트
- 시공간 이벤트 모델링을 위한 통합 벤치마킹 프레임워크 SEAHORSE 제안
- encode-evolve-decode 인터페이스를 통한 모델 공식화 표준화
- 단일 실행 가능한 프로토콜로 모델 간 공정한 비교 및 진단 가능
- HawkesNest 스트레스 테스트를 통한 모델별 귀납적 편향 분석
시공간 점 프로세스 (Spatiotemporal point processes, STPPs)는 이동성 (mobility), 역학 (epidemiology), 공공 안전 (public safety) 분야에 적용되어 연속적인 시간과 공간에서의 이벤트 데이터를 모델링합니다. 최근의 신경망 기반 STPPs는 표현력이 풍부한 강도 모델 (intensity models), 조건부 밀도 모델 (conditional density models), 연속 시간 잠재 역학 (continuous-time latent dynamics), 정규화 흐름 공간 디코더 (normalizing-flow spatial decoders), 그리고 스코어 기반 생성 메커니즘 (score-based generative mechanisms)에 이르기까지 폭넓게 다루고 있습니다. 그러나 구현 방식에 따라 전처리 (preprocessing), 좌표 정규화 (coordinate normalization), 데이터 분할 (splits), 가능도 관례 (likelihood conventions), 그리고 평가 프로토콜 (evaluation protocols)이 서로 다르기 때문에 비교 연구가 여전히 취약한 상태로 남아 있습니다. 우리는 재현 가능한 STPP 실험을 위한 통합 프레임워크인 SEAHORSE를 제안합니다. SEAHORSE는 공통된 encode-evolve-decode 인터페이스를 통해 신경망 기반 STPPs를 공식화하며, 원시 좌표 가능도 보고 (raw-coordinate likelihood reporting)를 포함한 단일 실행 가능한 벤치마크 프로토콜 하에서 모든 모델 제품군을 훈련, 튜닝 및 평가합니다. 이를 통해 공정한 비교가 가능해질 뿐만 아니라, 더 중요하게는 통제된 진단 연구 (controlled diagnostic studies)가 가능해집니다. 우리는 SEAHORSE를 합성 스트레스 테스트 스위트인 HawkesNest와 결합하여, 이벤트 패턴의 복잡성이 증가함에 따라 각 모델 제품군의 귀납적 편향 (inductive bias)이 드러나며, 일부 모델은 급격히 성능이 저하되는 반면 다른 모델들은 안정적으로 유지됨을 보여줍니다. 코드: https://github.com/YahyaAalaila/seahorse.
AI 자동 생성 콘텐츠
본 콘텐츠는 arXiv cs.LG의 원문을 AI가 자동으로 요약·번역·분석한 것입니다. 원 저작권은 원저작자에게 있으며, 정확한 내용은 반드시 원문을 확인해 주세요.
원문 바로가기