Insights
AI가 자동으로 큐레이션·번역·정리하는 기술 동향 피드입니다.
arXiv cs.LG 2125건필터 해제
규칙 기반 분류기 표현을 활용한 진화하는 멀웨어 가족의 개념 드리프트 탐지
본 연구는 결정 트리 규칙 집합을 활용하여 멀웨어 분류에서 발생하는 개념 드리프트(concept drift)를 탐지하는 구조적인 방법을 제안합니다. 이 방법은 특징 중요도, 예측 일치도, 활성화 안정성 등 여러 지표를 사용하여 데이터 분포 이동과 정확도 저하를 정량화하며, 가족 대 무해 및 가족 대 가족 설정에서 다양한 윈도우링 기법을 적용하여 평가되었습니다.
혼합 멤버십 서브가우시안 모델
본 논문은 고전적인 가우시안 혼합 모델(GMM)이 관측치를 하나의 성분에만 할당한다는 한계를 극복하기 위해 '혼합 멤버십 서브가우시안 모델'을 제안합니다. 이 새로운 모델은 각 관측치가 여러 잠재적 성분에 부분적으로 속할 수 있도록 허용하여, 유전학이나 텍스트 마이닝과 같은 복잡한 데이터 구조를 더 잘 포착합니다. 연구진은 개별 멤버십 추정을 위한 효율적인 스펙트럼 알고리즘을 개발했으며, 이 방법이 높은 확률로 낮은 추정 오차(vanishing-error)를 보장함을 증명했습니다.
CLVAE: 장기 고객 수익 예측을 위한 변분 오토인코더
본 논문은 희소하고 불규칙한 거래 데이터에서 고객의 장기 수익을 예측하기 위해 변분 오토인코더(VAE) 기반 모델인 CLVAE를 제안합니다. 이 모델은 기존 확률적 모델의 구조적 안정성을 유지하면서, 유연한 기계 학습 모델이 갖는 표현력 부족 문제를 해결하는 것을 목표로 합니다. CLVAE는 고객 이탈, 거래 및 지출을 단일 프레임워크에서 통합하고, 컨텍스트 공변량의 유무에 관계없이 높은 신뢰성과 예측 성능을 제공하여 마케팅 자원 배분 최적화에 기여합니다.
의미 보존 변환을 통한 Linux ELF 바이너리에서의 적대적 멀웨어 생성
본 논문은 최근 주목받았던 Windows PE 형식에 비해 연구가 부족했던 Linux ELF 바이너리 환경을 대상으로 적대적 멀웨어 생성 기법을 개발하고 그 성능을 입증합니다. 제안된 생성기는 다양한 지표로 평가되었으며, 평균적으로 탐지기의 신뢰도를 -0.50 낮추고 67.74%의 높은 회피율을 달성했습니다. 연구 결과, 적대적 공격에 성공적인 수정 사항은 유해하지 않은 파일에서 추출한 일반적인 문자열(strings)을 데이터 소스로 사용하며, 표적 분류기는 문자열 위치와 무관하게 민감하다는 것을 밝혀냈습니다.
연산성 - 첨예도 (Associativity-Peakiness) 지표를 위한 표본 교차표
이 논문은 클러스터링 알고리즘의 출력이 표본 교차표인 경우, 그 성능을 비교할 수 있는 새로운 단일 성능 지표인 '연산성 - 첨예도(Associativity-Peakiness, AP)' 지표를 제안합니다. 기존에는 이러한 형태의 출력에 대한 표준화된 평가 지표가 부족했으나, 본 연구는 AP 지표가 클러스터링 알고리즘의 비교 분석에 필수적임을 입증했습니다. 시뮬레이션 결과, AP 지표는 공개된 다른 지표들보다 더 넓은 동적 범위를 가지며 계산 효율성도 높다는 것을 보여주었습니다.
비선형 모델 예측 제어 (NMPC) 를 위한 반배치 공정에 대한 가우시안 프로세스 기반 반복적 모델 학습 기법
본 논문은 과도 현상과 비선형성을 가지는 배치 공정을 위한 모델 학습 NMPC(GP-MLMPC) 기법을 제안한다. 이 방법은 가우시안 프로세스(GP)를 활용하여 단일 초기 궤적 데이터만으로 시작하며, 반복적인 관측치 업데이트와 NMPC 적용을 통해 배치별로 성능을 개선한다. 실험 결과, GP-MLMPC는 추적 오차의 급격한 감소와 경제적 목표 달성 측면에서 높은 효율성을 보였으며, 전체 모델 NMPC에 필적하는 성능으로 비선형 공정 제어에 유망함을 입증했다.
Relaxation-Informed Training of Neural Network Surrogate Models
본 연구는 신경망 기반 서브로게이트 모델을 혼합 정수 선형 계획법(MILPs)에 통합하여 전역 최적화를 수행할 때, MILP의 계산 가능성을 향상시키는 새로운 학습 정규화자들을 제안합니다. 이 정규화자들은 특히 big-M 상수와 불안정한 뉴런 수를 벌점하거나, 연속형 LP 이완 간극을 명시적으로 최소화하는 방식으로 작동합니다. 실험 결과, 이러한 방법론은 MILP 해결 시간을 크게 단축시키면서도 서브로게이트 모델의 정확도를 유지할 수 있음을 입증했습니다.
소비를 줄이고 더 잘 적합화하기: 능동적 실험 선택을 통한 예산 효율적인 스케일링 법칙 적합
본 논문은 대규모 스케일링 법칙(scaling laws)을 적합화하는 과정의 높은 비용 문제를 해결하기 위해, 예산 인식 순차적 실험 설계(budget-aware sequential experimental design) 프레임워크를 제안합니다. 이 방법론은 제한된 비용 내에서 가장 정보량이 풍부한 실험들을 능동적으로 선택하여 고비용 목표 영역에서의 외삽 정확도를 극대화하는 것을 목표로 합니다. 제안된 불확실성 인식 접근 방식은 기존의 설계 기반 방법들보다 우수하며, 전체 훈련 예산의 소액만으로도 높은 적합화 성능을 달성할 수 있음을 입증했습니다.
지역 기반 신호가 포함된 구역 수준 클레임 빈도 모델 분석: 환경 및 시각 예측 변수를 사용한 실증 연구
본 논문은 공공 데이터셋의 한계로 인해 개인 수준의 지리적 정보를 활용하기 어려운 상황에서, 구역(zone-level) 단위의 환경 및 시각 데이터를 보험 손해율(MTPL claim frequency) 예측에 통합하는 방법을 제시합니다. OpenStreetMap과 CORINE Land Cover 같은 대체 데이터를 이용해 좌표와 환경 특성을 모델에 추가한 결과, GLM이나 트리 기반 모델 모두 정확도가 향상됨을 입증했습니다. 특히 5km 규모의 환경 특징과 좌표를 결합하거나, 환경 정보가 없을 때 Vision-Transformer(
파인튜닝 레짐이 고유한 지속적 학습 문제 정의
본 논문은 지속적 학습(Continual Learning, CL) 방법론 비교 시 '파인튜닝 레짐(Fine-Tuning Regime)'을 핵심 변수로 다루어야 한다고 주장합니다. 기존 연구들은 보통 고정된 파인튜닝 환경에서 모델 성능을 평가했지만, 이 논문은 학습 가능한 매개변수 부분 공간(trainable parameter subspace)의 깊이 변화가 모델 업데이트 신호와 지식 보존에 미치는 영향을 분석했습니다. 실험 결과, 다양한 적응 레짐(adaptation regimes)에서는 기존 CL 방법론들의 상대적 순위가 일관되게
스트리밍 지속적 학습에서의 시간적 과제화: 평가 불안정성의 원인
본 논문은 스트리밍 환경에서 이루어지는 연속 학습(Continual Learning, CL)의 평가 과정 자체에 구조적인 문제를 지적합니다. 일반적으로 데이터 스트림을 시간 단위로 분할하여 이산적인 작업(task)으로 변환하는 '시간적 태스크화(Temporal Taskification)' 과정이 중립적이지 않으며, 같은 원본 스트림이라도 분할 방식(split)에 따라 완전히 다른 학습 결과와 성능 지표를 유발할 수 있음을 보여줍니다. 이는 CL 벤치마크의 신뢰성에 근본적인 의문을 제기하며, 태스크화 방식을 모델 평가의 핵심 변수로다
Trust-SSL: 항공 이미지의 강건한 자기 지도 학습을 위한 새로운 접근법
본 논문은 안개, 모션 블러 등 심각하게 손상된 항공 이미지 환경에서 발생하는 자기 지도 학습(SSL)의 강건성 문제를 해결하기 위해 'Trust-SSL'을 제안합니다. 기존 SSL 방법들이 증강 뷰 간에 인변성(invariance)을 강제하는 방식은 의미론적 내용이 보존될 때 효과적이지만, 심각한 손상(corruption) 환경에서는 잘못된 구조를 학습할 위험이 있습니다. Trust-SSL은 정합 목표(alignment objective)에 샘플별/요인별 '신뢰 가중치(trust weight)'를 추가적인 잔차 항(additive
행동 트리 기반 분리형 여행 계획 (Behavior Forest)
본 논문은 복잡한 다중 제약 조건(multi-constraint)을 가진 여행 계획 문제를 해결하기 위해 'Behavior Forest'라는 새로운 프레임워크를 제안합니다. 기존 방식들이 모든 하위 작업과 제약을 하나의 결정 공간에 묶어 처리하면서 발생하는 높은 추론 부하와 비효율성을 개선하는 것이 목표입니다. Behavior Forest는 전체 과정을 여러 개의 병렬 행동 트리(behavior trees)로 분리하고, 각 트리가 특정 하위 작업을 담당하게 합니다. 여기에 전역 조정 메커니즘(global coordination)을
채널 독립적 인간 활동 인식(HAR)을 위한 융합 설계 방안
본 연구는 다양한 센서 환경과 이질적인 채널 구성을 가진 사물인터넷(IoT) 환경에서의 인간 활동 인식(HAR) 문제를 다룹니다. 기존의 채널 고정 모델은 특정 데이터셋이나 장치에 종속되어 재사용성이 떨어지는 한계가 있습니다. 이를 해결하기 위해, 본 논문은 입력 채널 구조를 가정하지 않는 '채널 프리(Channel-Free)' HAR 프레임워크를 제안합니다. 이 프레임워크는 개별 채널 인코딩과 조건부 배치 정규화(Conditional Batch Normalization)를 활용한 메타데이터 기반의 후기 융합(Late Fusion)
지도 학습의 본질적 기하학적 결함: 이론과 해결책 제시
본 논문은 경험적 위험 최소화(ERM) 기반 지도 학습이 필연적으로 갖는 '기하학적 맹점(Geometric Blind Spot)'을 수학적으로 증명합니다. 이 결함은 모델이 훈련 데이터의 레이블과 상관관계가 높은 방향에만 민감하게 반응하고, 테스트 시에는 무관한 노이즈 방향에서 취약해지는 구조적 문제입니다. 저자들은 이를 진단하는 새로운 지표인 '궤적 편차 지수(Trajectory Deviation Index, TDI)'를 제안하며, 기존의 적대적 훈련 방식들이 이 핵심적인 실패 모드를 포착하지 못함을 보여줍니다. 또한, PMH라는
대칭성 하 변분 추론 (VI)의 강건성 개선: 평균 복구 보장
본 논문은 근사하기 어려운 분포(intractable density)를 다루는 변분 추론(Variational Inference, VI)의 강건성 문제를 심화합니다. 일반적으로 사용되는 단순한 매개변수적 가정(variational family)이 목표 분포(target distribution)를 포함하지 못하는 '오지정(misspecification)' 상황에서, 대칭성(symmetries)을 활용하여 통계량(mean)의 정확한 복구를 보장할 수 있는 충분조건을 도출했습니다. 특히 전방 KL 발산(forward Kullback-Le
그린 적분 기반 신경망 솔버로 고주파 물리 문제 해결
기존의 PINNs는 이질 매체에서 높은 진동 특성을 가진 헬름홀츠(Helmholtz) 방정식을 시뮬레이션하는 데 어려움을 겪습니다. 본 논문은 PDE 잔차 최소화 방식 대신, 비국소적 제약 조건인 그린 적분 (Green-Integral, GI)을 활용하여 음향 헬름홀츠 방정식의 신경망 솔버를 제안합니다. 이 접근법은 공간 미분을 제거하고 물리적 해(outgoing radiation)를 내재적으로 구현하며, FFT 기반 컨볼루션을 통해 계산 효율성을 극대화했습니다. 또한, 국소 정확도를 높이기 위해 GI와 경량 헬름홀츠 잔차를 결합한
휴식 및 활동성 밴딧 문제에 모두 적용 가능한 단일 알고리즘 제안
본 논문은 추천 시스템이나 지능형 튜터링 시스템처럼 시간 경과에 따라 보상이 감소하는 '로팅 밴딧(rotting bandit)' 문제를 다룹니다. 기존 연구에서는 휴식성(rested) 밴딧과 활동성(restless) 밴딧을 분리하여 다루었으며, 두 환경 간의 성능 차이가 크다는 한계가 있었습니다. 본 논문은 이러한 이질적인 환경에 관계없이 근사 최적의 후회(regret)를 달성하는 새로운 알고리즘인 Rotting Adaptive Window UCB (RAW-UCB)를 제안합니다. RAW-UCB는 설정된 밴딧 유형이나 비정상성(non
VARestorer: 단일 단계 변이형 모델로 실시간 이미지 초해상도 구현
최근 주목받는 시각적 자기회귀 모델(VAR)은 이미지 생성에 강력하지만, 이를 실제 이미지 초해상도(Real-ISR) 작업에 적용하는 데 어려움이 있었습니다. 기존 방식의 순차적 예측(iterative prediction)은 전역적인 저화질(LQ) 컨텍스트를 충분히 활용하지 못하고 오류가 누적되어 흐릿하거나 일관성 없는 고화질(HQ) 결과를 초래했습니다. 본 논문에서 제안하는 VARestorer는 사전 학습된 텍스트-이미지 VAR 모델을 단일 단계(one-step) ISR 모델로 변환하는 효율적인 증류 프레임워크입니다. 분포 매칭(
미분 동역학 기반 궤적 및 정책 최적화를 위한 Tempered SMC (TSMC)
본 논문은 미분 가능한(differentiable) 동역학 환경에서 유한 시간 지평(finite-horizon)의 궤적 및 정책 최적화를 위한 새로운 샘플링 기반 프레임워크를 제시합니다. 핵심 방법론인 Tempered Sequential Monte Carlo (TSMC)는 KL 정규화된 기대 궤적 비용을 최소화하는 과정에서 얻어지는 '볼츠만 기울기 분포(Boltzmann-tilted)' 타겟 분포로부터 효율적으로 샘플링하기 위해 설계되었습니다. TSMC는 초기 분포부터 목표 분포까지 온도 변화 경로(tempering path)를 따
이 피드 구독하기
본 페이지의 콘텐츠는 AI가 공개된 소스를 기반으로 자동 수집·요약·번역한 것입니다. 원 저작권은 각 원저작자에게 있으며, 각 게시물의 “원문 바로가기” 링크를 통해 원문을 확인할 수 있습니다. 저작권자의 삭제 요청이 있을 경우 신속히 조치합니다.