본문으로 건너뛰기

© 2026 Molayo

arXiv논문2026. 06. 12. 16:13

클라우드 네트워크의 근본 원인 분석을 위한 그래프 인과 추론

요약

본 논문은 그래프 기반 인과 발견 기법을 활용하여 클라우드 네트워크 사고의 근본 원인 분석(RCA)에 새로운 접근 방식을 제시합니다. 시공간적 그룹화와 자동화 온톨로지를 도입해 복잡성을 줄이고, 이변량 Granger 인과성 및 조건부 독립성 테스트를 통해 인과 그래프를 구성했습니다. 실제 클라우드 운영 데이터셋에서 높은 정확도를 보여 실용성이 입증되었습니다.

핵심 포인트

  • 그래프 기반 기법으로 클라우드 네트워크 RCA에 새로운 접근 제시
  • 시공간적 그룹화 및 자동화 온톨로지로 복잡성 해결
  • Granger 인과성과 조건부 독립성 테스트를 활용한 인과 그래프 구성
  • 실제 운영 데이터셋에서 높은 정확도와 실용성을 입증함

클라우드 컴퓨팅은 본질적으로 복잡한 시스템인 대규모 네트워크에 의존합니다. 본 논문에서는 그래프 기반 인과 발견 기법을 활용하여 클라우드 네트워크 사고의 근본 원인 분석(RCA)을 위한 새로운 접근 방식을 제시합니다. 저희 방법론은 시공간적 그룹화 전략과 자동화 온톨로지를 도입하여 문제의 차원을 줄임으로써 규칙 기반 자동화의 한계를 해결합니다. 저희는 이변량 Granger 인과성 및 조건부 독립성 테스트를 사용하여 이진 시계열 데이터로부터 인과 그래프를 구성합니다. 추론을 위해, 시간 지연(time lag)의 함수로 엣지별 조건부 확률을 할당하는 확률적 방법을 도입하여, 인과 그래프 탐색을 통해 해석 가능하고 시간 인식적인 근본 원인 점수화를 가능하게 합니다. 저희는 주요 클라우드 제공업체의 레이블링된 35개 운영 사고 데이터셋을 사용하여 시스템을 평가했습니다. 이 모델은 사고의 85.7%에서 정확한 근본 원인을 회상했으며, 74.3%에서 정확히 일치하는 결과를 도출했습니다. 실제 운영 환경에서는 배포된 시스템이 800건 이상의 실세계 사고에 사용되었으며, 네트워크 엔지니어들로부터 긍정적인 정성적 피드백을 받았습니다. 이러한 결과는 동적이고 대규모의 운영 환경에서 데이터 기반의 인과 접근 방식이 RCA에 얼마나 실용적인지를 강조합니다.

AI 자동 생성 콘텐츠

본 콘텐츠는 arXiv cs.LG의 원문을 AI가 자동으로 요약·번역·분석한 것입니다. 원 저작권은 원저작자에게 있으며, 정확한 내용은 반드시 원문을 확인해 주세요.

원문 바로가기
0

댓글

0