데이터가 제한된 상황에서의 교차 도메인 베어링 결함 진단을 위한 LLM 기반 2단계 Transformer 프레임워크
요약
데이터가 부족하고 도메인이 다른 환경에서 베어링 결함을 진단하기 위한 LLM 기반 2단계 Transformer 프레임워크를 제안합니다. GPT-2 스타일의 구조와 프로토타입 임베딩을 활용해 적은 레이블 데이터로도 높은 진단 정확도를 달성했습니다.
핵심 포인트
- GPT-2 스타일의 경량 Transformer를 활용한 계층적 특징 추출
- 다중 소스 사전 학습과 프로토타입 기반 지식 변조 기술 적용
- 단 10%의 타겟 데이터만으로 92.61%의 높은 정확도 기록
- Industry 4.0을 위한 비용 효율적인 예지 보전 솔루션 제시
산업 환경에서 데이터셋의 이질성(heterogeneity), 운전 조건의 변화, 그리고 제한된 레이블 데이터(labeled data)가 동시에 발생할 때 베어링 결함 진단(Bearing fault diagnosis)은 심각한 과제에 직면합니다. 기존의 방식들은 이러한 문제들을 개별적으로 다루며 암시적인 특징 정렬(implicit feature alignment)에 의존하기 때문에, 여러 과제가 동시에 발생하는 상황에서의 효과가 제한적입니다. 본 논문은 지식 가이드형 2단계 전이 학습(two-stage transfer learning) 프레임워크를 제안합니다. 이 프레임워크는 진동 신호로부터 계층적 특징 추출(hierarchical feature extraction)을 위해 인과적 셀프 어텐션(causal self-attention)을 사용하는 경량 GPT-2 스타일의 Transformer를 채택하며, 사전 학습된 인코더 가중치(pre-trained encoder weights)와 결함 프로토타입 임베딩(fault prototype embeddings)이 다중 소스 사전 학습(multi-source pre-training)에서 타겟 적응(target adaptation)으로 지식 전달자 역할을 수행하는 명시적인 경로를 구축합니다. 이 프레임워크는 일반화 가능한 표현(generalizable representations)을 위한 다중 소스 학습(multi-source learning), 타겟 적응을 위한 프로토타입 기반 지식 변조(prototype-based knowledge modulation), 그리고 이질적인 결함 범주 간의 원활한 전이를 위한 분류 체계 적응형 분류(taxonomy-adaptive classification)를 통해 이중 변화(dual-shift) 문제를 해결합니다. 4개의 실제 데이터셋에 대한 실험적 검증 결과, 단 10%의 레이블된 타겟 데이터만으로도 평균 92.61%의 정확도를 달성하였으며, 이는 최신 기술(state-of-the-art) 방법들보다 17.24%포인트 높은 수치입니다. 이는 Industry 4.0 응용 분야에서 비용 효율적인 예지 보전(predictive maintenance)을 향한 실질적인 경로를 제시합니다.
AI 자동 생성 콘텐츠
본 콘텐츠는 arXiv cs.LG의 원문을 AI가 자동으로 요약·번역·분석한 것입니다. 원 저작권은 원저작자에게 있으며, 정확한 내용은 반드시 원문을 확인해 주세요.
원문 바로가기