본문으로 건너뛰기

© 2026 Molayo

arXiv논문2026. 06. 26. 10:12

다운스트림 태스크를 위한 로그 정제 (등록 보고서)

요약

로그 데이터 내 중복되거나 무관한 정보를 제거하여 모델 추론 및 이상 탐지 성능을 높이는 LogPurifier 방법론을 제안합니다. 로그 메시지 템플릿 간의 의존 관계를 활용하여 태스크에 구애받지 않는 정제 방식을 연구합니다.

핵심 포인트

  • 로그 데이터의 노이즈가 다운스트림 태스크 성능에 미치는 부정적 영향 분석
  • LogPurifier: 메시지 템플릿 의존 관계 기반의 태스크 불가지론적 정제 방식 제안
  • 모델 추론 및 이상 탐지 태스크에서의 효과성과 효율성 검증

배경: 소프트웨어 시스템은 문제 해결(troubleshooting) 및 모니터링을 위해 실행 중 중요한 이벤트와 런타임 정보를 기록하는 로그(logs)를 생성합니다. 그러나 실제로는 로그에 상당한 양의 중복되거나 무관한 정보가 포함되는 경우가 많으며, 이는 모델 추론(model inference) 및 이상 탐지(anomaly detection)와 같은 다운스트림 분석 태스크(downstream analysis tasks)의 성능에 부정적인 영향을 미칠 수 있습니다. 목적: 본 연구의 목적은 관심 있는 실행 동작과 관련이 없으면서 시스템의 기능적 동작을 캡처하는 메시지들 사이에 끼어 있는 독립 메시지(free-standing messages)를 식별하고 제거함으로써 로그 데이터를 정제하는 것입니다. 방법: 이 목적을 달성하기 위해, 우리는 로그 메시지 템플릿(log message templates) 간의 의존 관계(dependency relationships)를 기반으로 하는 태스크 불가지론적(task-agnostic) 로그 정제 접근 방식인 LogPurifier를 제안합니다. 본 논문은 모델 추론(model inference)과 이상 탐지(anomaly detection)라는 두 가지 다운스트림 태스크의 효과성과 효율성에 LogPurifier가 미치는 영향을 평가하기 위해, 통제된 실험 설계(controlled experimental design)를 사용한 실증적 평가 계획을 제시합니다.

AI 자동 생성 콘텐츠

본 콘텐츠는 arXiv Codex (cs.SE)의 원문을 AI가 자동으로 요약·번역·분석한 것입니다. 원 저작권은 원저작자에게 있으며, 정확한 내용은 반드시 원문을 확인해 주세요.

원문 바로가기
0

댓글

0