본문으로 건너뛰기

© 2026 Molayo

arXiv중요논문2026. 04. 24. 21:43

TingIS: 엔터프라이즈 규모의 노이즈가 많은 고객 인시던트로부터 실시간 위험 이벤트 발견

요약

대규모 클라우드 네이티브 서비스에서 고객 인시던트 데이터는 중요한 위험 신호원이지만, 노이즈와 복잡성 때문에 활용하기 어렵습니다. 논문 'TingIS'는 이러한 문제를 해결하기 위해 개발된 엔드투엔드 시스템입니다. TingIS는 효율적인 인덱싱 기법과 대규모 언어 모델(LLMs)을 결합한 다단계 이벤트 연결 엔진을 핵심으로 사용합니다. 이 시스템은 2,000 메시지/분 이상의 피크 처리량을 자랑하며, 높은 정확도와 낮은 지연 시간으로 실제 비즈니스 위험을 실시간으로 발견하고 경고할 수 있게 합니다.

핵심 포인트

  • TingIS는 고객 인시던트 데이터에서 발생하는 노이즈와 복잡성을 극복하는 엔드투엔드 시스템입니다.
  • 핵심은 효율적인 인덱싱과 LLMs를 결합한 다단계 이벤트 연결 엔진으로, 사용자 설명만으로도 실행 가능한(actionable) 인시던트를 추출합니다.
  • 실제 운영 환경에서 분당 2,000개 이상의 피크 처리량을 처리하며, P90 경고 지연 시간은 3.5분입니다.
  • 기존 방식 대비 라우팅 정확도, 클러스터링 품질, 신호 대 노이즈 비율(Signal-to-Noise Ratio)에서 우수한 성능을 입증했습니다.

TingIS: 엔터프라이즈 규모의 노이즈가 많은 고객 인시던트로부터 실시간 위험 이벤트 발견

대규모 클라우드 네이티브(cloud-native) 서비스에서 기술적 이상 징후를 실시간으로 탐지하고 완화하는 것은 매우 중요합니다. 왜냐하면 단 몇 분의 다운타임만으로도 막대한 재정적 손실과 사용자 신뢰 하락을 초래할 수 있기 때문입니다. 고객 인시던트는 모니터링 시스템이 놓칠 수 있는 위험을 발견하는 데 필수적인 신호 역할을 하지만, 극심한 노이즈(noise), 높은 처리량(high throughput), 그리고 다양한 비즈니스 라인의 의미론적 복잡성(semantic complexity) 때문에 이 데이터에서 실행 가능한 인텔리전스(actionable intelligence)를 추출하는 것은 여전히 어렵습니다.

본 논문에서는 엔터프라이즈급 인시던트 발견을 위해 설계된 종단 간(end-to-end) 시스템인 TingIS를 소개합니다. TingIS의 핵심은 효율적인 색인화 기술(indexing techniques)과 대규모 언어 모델(Large Language Models, LLMs)을 결합하여 이벤트 병합(event merging)에 대한 정보에 입각한 의사결정을 내리는 다단계 이벤트 연결 엔진(multi-stage event linking engine)입니다. 이를 통해 소수의 다양한 사용자 설명만으로도 실행 가능한 인시던트를 안정적으로 추출할 수 있습니다. 이 엔진은 정확한 비즈니스 귀속(business attribution)을 위한 계단식 라우팅 메커니즘(cascaded routing mechanism)과 도메인 지식, 통계적 패턴, 행동 필터링을 통합하는 다차원 노이즈 감소 파이프라인(multi-dimensional noise reduction pipeline)으로 보완됩니다.

시간당 2,000개 이상의 메시지 처리량 및 일일 30만 개의 메시지를 처리하는 프로덕션 환경에 배포된 TingIS는 P90 알림 지연 시간(alert latency) 3.5분과 고우선순위 인시던트의 95% 발견율을 달성합니다. 실제 데이터를 기반으로 구축된 벤치마크는 TingIS가 라우팅 정확도, 클러스터링 품질, 그리고 신호 대 노이즈 비율(Signal-to-Noise Ratio) 측면에서 기준선 방법론(baseline methods)보다 현저히 우수함을 입증합니다.

AI 자동 생성 콘텐츠

본 콘텐츠는 arXiv cs.AI의 원문을 AI가 자동으로 요약·번역·분석한 것입니다. 원 저작권은 원저작자에게 있으며, 정확한 내용은 반드시 원문을 확인해 주세요.

원문 바로가기
5

댓글

0