본문으로 건너뛰기

© 2026 Molayo

arXiv중요논문2026. 04. 24. 21:43

TingIS: 대규모 엔터프라이즈 환경의 실시간 리스크 이벤트 발견 시스템

요약

대규모 클라우드 네이티브 서비스에서 고객 인시던트 데이터는 중요한 위험 신호원이지만, 노이즈와 복잡성 때문에 활용하기 어렵습니다. 논문 'TingIS'는 이러한 문제를 해결하기 위해 개발된 엔드투엔드 시스템입니다. TingIS는 효율적인 인덱싱 기법과 대규모 언어 모델(LLMs)을 결합한 다단계 이벤트 연결 엔진을 핵심으로 사용합니다. 이 시스템은 2,000 메시지/분 이상의 피크 처리량을 자랑하며, 높은 정확도와 낮은 지연 시간으로 실제 비즈니스 위험을 실시간으로 발견하고 경고할 수 있게 합니다.

핵심 포인트

  • TingIS는 고객 인시던트 데이터에서 발생하는 노이즈와 복잡성을 극복하는 엔드투엔드 시스템입니다.
  • 핵심은 효율적인 인덱싱과 LLMs를 결합한 다단계 이벤트 연결 엔진으로, 사용자 설명만으로도 실행 가능한(actionable) 인시던트를 추출합니다.
  • 실제 운영 환경에서 분당 2,000개 이상의 피크 처리량을 처리하며, P90 경고 지연 시간은 3.5분입니다.
  • 기존 방식 대비 라우팅 정확도, 클러스터링 품질, 신호 대 노이즈 비율(Signal-to-Noise Ratio)에서 우수한 성능을 입증했습니다.

TingIS: Real-time Risk Event Discovery from Noisy Customer Incidents at Enterprise Scale

Real-time detection and mitigation of technical anomalies are critical for large-scale cloud-native services, where even minutes of downtime can result in massive financial losses and diminished user trust. While customer incidents serve as a vital signal for discovering risks missed by monitoring, extracting actionable intelligence from this data remains challenging due to extreme noise, high throughput, and semantic complexity of diverse business lines.

In this paper, we present TingIS, an end-to-end system designed for enterprise-grade incident discovery. At the core of TingIS is a multi-stage event linking engine that synergizes efficient indexing techniques with Large Language Models (LLMs) to make informed decisions on event merging, enabling the stable extraction of actionable incidents from just a handful of diverse user descriptions. This engine is complemented by a cascaded routing mechanism for precise business attribution and a multi-dimensional noise reduction pipeline that integrates domain knowledge, statistical patterns, and behavioral filtering.

Deployed in a production environment handling a peak throughput of over 2,000 messages per minute and 300,000 messages per day, TingIS achieves a P90 alert latency of 3.5 minutes and a 95% discovery rate for high-priority incidents. Benchmarks constructed from real-world data demonstrate that TingIS significantly outperforms baseline methods in routing accuracy, clustering quality, and Signal-to-Noise Ratio.

AI 자동 생성 콘텐츠

본 콘텐츠는 arXiv cs.AI의 원문을 AI가 자동으로 요약·번역·분석한 것입니다. 원 저작권은 원저작자에게 있으며, 정확한 내용은 반드시 원문을 확인해 주세요.

원문 바로가기
3

댓글

0