Insights
AI가 자동으로 큐레이션·번역·정리하는 기술 동향 피드입니다.
arXiv cs.LG 272건필터 해제
자연 도메인 기반 모델이 가속화된 심장 MRI 재구성 가속화에 효과적인가?
본 연구는 자연 도메인 기반의 대규모 기초 모델(foundation model)이 가속화된 심장 MRI 재구성에 효과적인 이미지 사전으로 사용될 수 있는지 탐구합니다. 제안된 언롤드 재구성 프레임워크는 CLIP, DINOv2 등 다양한 고정 시각 인코더를 통합하여 재구성 과정을 안내하며, 표준 분포 및 도전적인 교차 도메인 시나리오에서 성능을 평가했습니다. 실험 결과, 기초 모델 기반 접근법은 특히 높은 가속화 인자 및 제한된 샘플링 조건 하에서 뛰어난 견고성과 일반화 능력을 보여주었으며, 이는 전이 가능한 구조적 표현의 유망한 출처임을 입증합니다.
복잡한 항공기 생산 시스템용 다변수 극단 공간 모델
본 논문은 복잡한 항공기 생산 시스템과 같은 다변수 환경에서 발생하는 비정상적이고 극단적인 사건(extreme events)을 분석하기 위한 '다변수 극단 공간 모델'을 제안합니다. 기존의 머신러닝 모델이 평균 패턴에 집중하는 한계를 넘어, 무거운 꼬리를 가진 분포에서 발생하는 복잡한 극단 위험을 포착할 수 있습니다. 이 모델은 두 개의 공간 영역에서의 쌍선형 함수를 사용하여 동역학을 효율적으로 모델링하며, 그래프 보조 합성 가능도 추정 기법과 결합하여 높은 예측 성능을 입증했습니다.
악성코드와 탐지 모델의 적대적 공진화: 이계수준 최적화 관점
본 논문은 기계 학습 기반 악성코드 탐지기가 적응형 공격자에게 취약한 문제를 다루며, 방어자와 공격자의 전략적 상호작용을 모델링하기 위해 이계수준 최적화(bilevel optimization) 기반의 견고한 방어 프레임워크를 제안합니다. MAB-malware 프레임워크로 세 가지 악성코드 계열에 대한 실험 결과, 기존 방법들이 높은 우회율을 보이는 반면, 제안된 이계수준 최적화 접근법은 거의 완전한 면역성을 달성하여 탐지 시스템의 탄력성을 크게 향상시켰습니다. 이는 적대적 위협에 대응하기 위해 공격과 방어의 반복 주기를 모델링하는 것이 필수적임을 시사합니다.
의생명 이미지에 유용한 비강인성 특징이 널리 존재한다
본 연구는 의료 이미지 분석을 위한 딥러닝 모델이 인간에게 해석 불가능하고 적대적 교란에 취약한 '유용한 비강인성 특징'을 학습하는지, 그리고 이것이 실제 성능에 미치는 영향을 조사했습니다. 오직 이러한 비강인성 특징만을 사용해 훈련된 모델은 표준 데이터 분포 내(in-distribution)에서 높은 정확도를 보였으나, 적대적으로 훈련되어 강인성에 초점을 맞춘 모델들은 분포 외(out-of-distribution) 환경에서 훨씬 우수한 성능을 나타냈습니다. 결론적으로, 의생명 영상 분류 작업에서는 실용적인 강인성-정확도 트레이드오프를 고려하여 모델을 조정해야 함을 시사합니다.
WassersteinGrad 를 활용한 동적 물리장 예측 설명: 자기회귀 기상 예보에의 적용
본 논문은 기상 예측과 같은 동적 물리장(dynamic physical fields)의 자기회귀 신경망 예측을 설명하는 새로운 방법인 WassersteinGrad를 제안합니다. 기존의 점별 평균 기반 귀속 맵 집계 전략이 공간적으로 정렬되지 않은 특징에 취약하여 '기하학적 이동' 문제를 일으키는 것을 해결하기 위해, WassersteinGrad는 엔트로피 Wasserstein 바리센터를 사용하여 교란된 귀속 맵들의 기하학적 합의(geometric consensus)를 추출합니다. 이 방법은 단일 단계 및 자기회귀 예보 설정 모두에서 기존 경계 기반 방법보다 우수한 설명 가능성을 보여주었습니다.
효율적인 멀티헤드 어텐션 을 위한 적응형 헤드 예산 할당
본 논문은 표준 다중 헤드 어텐션(Multi-Head Attention)이 모든 입력에 대해 균일하게 작동하여 불필요한 계산 비용을 발생시키는 문제를 해결하고자 합니다. 이를 위해 'BudgetFormer'라는 적응형 메커니즘을 제안하며, 이 모델은 각 입력에 필요한 주의 헤드의 수('헤드 예산')와 가장 정보량이 많은 헤드를 선택하는 '관련성 분포'를 동적으로 학습합니다. 실험 결과, BudgetFormer는 표준 어텐션 대비 FLOPs 및 메모리 사용량을 크게 줄이면서도 텍스트 분류 등 다양한 작업에서 우수한 성능을 입증했습니다.
환자 불변성을 넘어: 행동 조건부 JEPAs 를 통한 심장 동역학 학습
본 논문은 의료 분야의 자기지도학습(SSL)이 기존에 사용해 온 환자 불변성 기반 목표가 정적인 해부학적 특징 학습에만 국한되어 임상 진단과 괴리가 있음을 지적하며, 이를 극복하기 위해 행동 조건부 월드 모델(Action-Conditioned World Models)을 제안합니다. 이 프레임워크는 질병 진행의 동역학을 시뮬레이션하거나 사건 조건부 학습을 가능하게 하여, 병리학을 정적 레이블이 아닌 환자의 잠재 상태에 작용하는 전이 벡터로 정의합니다. MIMIC-IV-ECG 데이터셋에서 테스트한 결과, 이 접근법은 중요한 선별 작업에서 완전 지도학습 기반선보다 우수한 성능과 높은 샘플 효율성을 보여주었습니다.
규칙 기반 분류기 표현을 활용한 진화하는 멀웨어 가족의 개념 드리프트 탐지
본 연구는 결정 트리 규칙 집합을 활용하여 멀웨어 분류에서 발생하는 개념 드리프트(concept drift)를 탐지하는 구조적인 방법을 제안합니다. 이 방법은 특징 중요도, 예측 일치도, 활성화 안정성 등 여러 지표를 사용하여 데이터 분포 이동과 정확도 저하를 정량화하며, 가족 대 무해 및 가족 대 가족 설정에서 다양한 윈도우링 기법을 적용하여 평가되었습니다.
혼합 멤버십 서브가우시안 모델
본 논문은 고전적인 가우시안 혼합 모델(GMM)이 관측치를 하나의 성분에만 할당한다는 한계를 극복하기 위해 '혼합 멤버십 서브가우시안 모델'을 제안합니다. 이 새로운 모델은 각 관측치가 여러 잠재적 성분에 부분적으로 속할 수 있도록 허용하여, 유전학이나 텍스트 마이닝과 같은 복잡한 데이터 구조를 더 잘 포착합니다. 연구진은 개별 멤버십 추정을 위한 효율적인 스펙트럼 알고리즘을 개발했으며, 이 방법이 높은 확률로 낮은 추정 오차(vanishing-error)를 보장함을 증명했습니다.
CLVAE: 장기 고객 수익 예측을 위한 변분 오토인코더
본 논문은 희소하고 불규칙한 거래 데이터에서 고객의 장기 수익을 예측하기 위해 변분 오토인코더(VAE) 기반 모델인 CLVAE를 제안합니다. 이 모델은 기존 확률적 모델의 구조적 안정성을 유지하면서, 유연한 기계 학습 모델이 갖는 표현력 부족 문제를 해결하는 것을 목표로 합니다. CLVAE는 고객 이탈, 거래 및 지출을 단일 프레임워크에서 통합하고, 컨텍스트 공변량의 유무에 관계없이 높은 신뢰성과 예측 성능을 제공하여 마케팅 자원 배분 최적화에 기여합니다.
의미 보존 변환을 통한 Linux ELF 바이너리에서의 적대적 멀웨어 생성
본 논문은 최근 주목받았던 Windows PE 형식에 비해 연구가 부족했던 Linux ELF 바이너리 환경을 대상으로 적대적 멀웨어 생성 기법을 개발하고 그 성능을 입증합니다. 제안된 생성기는 다양한 지표로 평가되었으며, 평균적으로 탐지기의 신뢰도를 -0.50 낮추고 67.74%의 높은 회피율을 달성했습니다. 연구 결과, 적대적 공격에 성공적인 수정 사항은 유해하지 않은 파일에서 추출한 일반적인 문자열(strings)을 데이터 소스로 사용하며, 표적 분류기는 문자열 위치와 무관하게 민감하다는 것을 밝혀냈습니다.
연산성 - 첨예도 (Associativity-Peakiness) 지표를 위한 표본 교차표
이 논문은 클러스터링 알고리즘의 출력이 표본 교차표인 경우, 그 성능을 비교할 수 있는 새로운 단일 성능 지표인 '연산성 - 첨예도(Associativity-Peakiness, AP)' 지표를 제안합니다. 기존에는 이러한 형태의 출력에 대한 표준화된 평가 지표가 부족했으나, 본 연구는 AP 지표가 클러스터링 알고리즘의 비교 분석에 필수적임을 입증했습니다. 시뮬레이션 결과, AP 지표는 공개된 다른 지표들보다 더 넓은 동적 범위를 가지며 계산 효율성도 높다는 것을 보여주었습니다.
비선형 모델 예측 제어 (NMPC) 를 위한 반배치 공정에 대한 가우시안 프로세스 기반 반복적 모델 학습 기법
본 논문은 과도 현상과 비선형성을 가지는 배치 공정을 위한 모델 학습 NMPC(GP-MLMPC) 기법을 제안한다. 이 방법은 가우시안 프로세스(GP)를 활용하여 단일 초기 궤적 데이터만으로 시작하며, 반복적인 관측치 업데이트와 NMPC 적용을 통해 배치별로 성능을 개선한다. 실험 결과, GP-MLMPC는 추적 오차의 급격한 감소와 경제적 목표 달성 측면에서 높은 효율성을 보였으며, 전체 모델 NMPC에 필적하는 성능으로 비선형 공정 제어에 유망함을 입증했다.
Relaxation-Informed Training of Neural Network Surrogate Models
본 연구는 신경망 기반 서브로게이트 모델을 혼합 정수 선형 계획법(MILPs)에 통합하여 전역 최적화를 수행할 때, MILP의 계산 가능성을 향상시키는 새로운 학습 정규화자들을 제안합니다. 이 정규화자들은 특히 big-M 상수와 불안정한 뉴런 수를 벌점하거나, 연속형 LP 이완 간극을 명시적으로 최소화하는 방식으로 작동합니다. 실험 결과, 이러한 방법론은 MILP 해결 시간을 크게 단축시키면서도 서브로게이트 모델의 정확도를 유지할 수 있음을 입증했습니다.
소비를 줄이고 더 잘 적합화하기: 능동적 실험 선택을 통한 예산 효율적인 스케일링 법칙 적합
본 논문은 대규모 스케일링 법칙(scaling laws)을 적합화하는 과정의 높은 비용 문제를 해결하기 위해, 예산 인식 순차적 실험 설계(budget-aware sequential experimental design) 프레임워크를 제안합니다. 이 방법론은 제한된 비용 내에서 가장 정보량이 풍부한 실험들을 능동적으로 선택하여 고비용 목표 영역에서의 외삽 정확도를 극대화하는 것을 목표로 합니다. 제안된 불확실성 인식 접근 방식은 기존의 설계 기반 방법들보다 우수하며, 전체 훈련 예산의 소액만으로도 높은 적합화 성능을 달성할 수 있음을 입증했습니다.
지역 정보 활용으로 자동차 보험 손해율 예측 모델 성능 향상 연구
본 논문은 공공 데이터셋의 한계로 인해 개인 수준의 지리적 정보를 활용하기 어려운 상황에서, 구역(zone-level) 단위의 환경 및 시각 데이터를 보험 손해율(MTPL claim frequency) 예측에 통합하는 방법을 제시합니다. OpenStreetMap과 CORINE Land Cover 같은 대체 데이터를 이용해 좌표와 환경 특성을 모델에 추가한 결과, GLM이나 트리 기반 모델 모두 정확도가 향상됨을 입증했습니다. 특히 5km 규모의 환경 특징과 좌표를 결합하거나, 환경 정보가 없을 때 Vision-Transformer(
지속적 학습(CL) 평가의 새로운 관점: 파인튜닝 레짐 분석
본 논문은 지속적 학습(Continual Learning, CL) 방법론 비교 시 '파인튜닝 레짐(Fine-Tuning Regime)'을 핵심 변수로 다루어야 한다고 주장합니다. 기존 연구들은 보통 고정된 파인튜닝 환경에서 모델 성능을 평가했지만, 이 논문은 학습 가능한 매개변수 부분 공간(trainable parameter subspace)의 깊이 변화가 모델 업데이트 신호와 지식 보존에 미치는 영향을 분석했습니다. 실험 결과, 다양한 적응 레짐(adaptation regimes)에서는 기존 CL 방법론들의 상대적 순위가 일관되게
스트리밍 연속 학습 평가의 불안정성: 시간적 태스크화 문제 제기
본 논문은 스트리밍 환경에서 이루어지는 연속 학습(Continual Learning, CL)의 평가 과정 자체에 구조적인 문제를 지적합니다. 일반적으로 데이터 스트림을 시간 단위로 분할하여 이산적인 작업(task)으로 변환하는 '시간적 태스크화(Temporal Taskification)' 과정이 중립적이지 않으며, 같은 원본 스트림이라도 분할 방식(split)에 따라 완전히 다른 학습 결과와 성능 지표를 유발할 수 있음을 보여줍니다. 이는 CL 벤치마크의 신뢰성에 근본적인 의문을 제기하며, 태스크화 방식을 모델 평가의 핵심 변수로다
Trust-SSL: 항공 이미지의 강건한 자기 지도 학습을 위한 새로운 접근법
본 논문은 안개, 모션 블러 등 심각하게 손상된 항공 이미지 환경에서 발생하는 자기 지도 학습(SSL)의 강건성 문제를 해결하기 위해 'Trust-SSL'을 제안합니다. 기존 SSL 방법들이 증강 뷰 간에 인변성(invariance)을 강제하는 방식은 의미론적 내용이 보존될 때 효과적이지만, 심각한 손상(corruption) 환경에서는 잘못된 구조를 학습할 위험이 있습니다. Trust-SSL은 정합 목표(alignment objective)에 샘플별/요인별 '신뢰 가중치(trust weight)'를 추가적인 잔차 항(additive
행동 트리 기반 분리형 여행 계획 (Behavior Forest)
본 논문은 복잡한 다중 제약 조건(multi-constraint)을 가진 여행 계획 문제를 해결하기 위해 'Behavior Forest'라는 새로운 프레임워크를 제안합니다. 기존 방식들이 모든 하위 작업과 제약을 하나의 결정 공간에 묶어 처리하면서 발생하는 높은 추론 부하와 비효율성을 개선하는 것이 목표입니다. Behavior Forest는 전체 과정을 여러 개의 병렬 행동 트리(behavior trees)로 분리하고, 각 트리가 특정 하위 작업을 담당하게 합니다. 여기에 전역 조정 메커니즘(global coordination)을
이 피드 구독하기
본 페이지의 콘텐츠는 AI가 공개된 소스를 기반으로 자동 수집·요약·번역한 것입니다. 원 저작권은 각 원저작자에게 있으며, 각 게시물의 “원문 바로가기” 링크를 통해 원문을 확인할 수 있습니다. 저작권자의 삭제 요청이 있을 경우 신속히 조치합니다.