본문으로 건너뛰기

© 2026 Molayo

Insights

AI가 자동으로 큐레이션·번역·정리하는 기술 동향 피드입니다.

arXiv cs.LG 272필터 해제

arXiv논문

리만 기하학적 특징과 RNN 을 활용한 고차원 손가락 운동 디코딩

본 논문은 근전도(EMG) 신호를 활용하여 고차원 손가락 운동학을 연속적으로 추정하는 엔드투엔드 프레임워크를 제시합니다. 기존의 분류 기반 방식이 가진 자유도 제한 문제를 해결하기 위해, 연구진은 8채널 EMG와 손가락 관절 각도를 포함한 대규모 데이터셋(EMG-FK)을 구축했습니다. 핵심 모델인 Temporal Riemannian Regressor (TRR)는 리만 기하학적 특징과 GRU를 결합하여 운동 디코딩의 정확도와 실시간성을 모두 높였으며, 이는 임베디드 시스템에서의 자연스러운 제어 구현 가능성을 입증합니다.

emgmotion-decodingriemannian-geometry
6일 전3
arXiv논문

전국적 일본 의료 청구 기반 모델: 모델 스케일링과 작업별 계산 효율성의 균형

본 연구는 전국 일본 병원 청구 데이터를 활용하여 구조화된 의료 데이터에 대한 모델 스케일링 법칙을 탐구했습니다. 5가지 크기의 인코더 전용 트랜스포머를 사전 훈련하고 질병 및 약물 예측과 같은 다운스트림 작업을 평가한 결과, 모델의 최적 크기가 작업 특성에 따라 다르게 나타났습니다. 특히, 질병 예측은 더 큰 모델에서 이득을 얻었으나, 약물 예측은 비교적 작은 규모(1100만 파라미터)에서 성능이 포화되어 계산 효율성을 크게 개선할 수 있음을 보여주었습니다.

medical-aifoundation-modelsnlp
4월 28일4
arXiv논문

연속 학습에서 Adam 을 위한 경량 수정의 숨겨진 실패 모드와 적응적 디커플링 모멘트 라우팅을 통한 복구

본 논문은 연속 학습(Continual Learning)에서 Adam 최적화기를 사용하는 여러 기법들이 숨겨진 실패 모드를 가지고 있음을 보여줍니다. 특히 고중첩 환경에서 공유 라우팅 투영 기반의 방법들은 성능이 크게 저하되는 경향을 보입니다. 연구진은 이 문제를 Adam의 2차 모멘트 경로가 이전 방향의 유효 학습률에 과도한 확장을 유도하기 때문임을 밝혀냈으며, 이를 해결하기 위해 수정된 기울기를 1차 모멘트에만 라우팅하고 적응적 디커플링 강도를 적용하는 새로운 방법을 제안했습니다. 이 방법은 기존 방식들이 실패했던 다양한 설정에서 안정적인 성능 개선을 입증했습니다.

continual-learningadam-optimizergradient-routing
4월 27일4
arXiv논문

지표면 온도 너머: 설명 가능한 공간 기계 학습이 인간 중심 열 스트레스에 대한 도시 형태 영향 규명

본 연구는 기존의 지표면 온도(LST) 기반 접근 방식의 한계를 극복하고, 인간 중심의 생리학적 열 스트레스 지수인 보편적 열 기후 지수(UTCI)와 LST를 비교 분석하는 포괄적인 프레임워크를 제시합니다. 싱가포르 데이터를 활용하여 GPU 가속화된 1m UTCI와 Landsat 기반 30m LST의 공간적 차이를 모델링하고, XGBoost 및 GAM과 같은 설명 가능한 기계 학습 모델을 적용했습니다. 분석 결과, 하늘 시야 계수(sky view factor)가 UTCI 변동성을 주도하는 반면, LST는 인간 열 스트레스와 관련된 복사 과정을 충분히 포착하지 못한다는 점이 밝혀졌습니다. 이는 도시 계획 및 기후 적응형 위험 관리에 생리학적 관련성이 높은 지표를 통합해야 함을 시사합니다.

urban-heat-islandutciexplainable-ai
4월 27일3
arXiv논문

Contrastive Semantic Projection: Contrastive Examples 를 활용한 충실한 뉴런 라벨링

본 논문은 딥러닝 네트워크 내부 단위(뉴런)에 충실한 텍스트 설명을 할당하는 '뉴런 라벨링' 기법을 개선합니다. 기존 방식이 높은 활성화 예시에 의존하여 광범위하거나 부정확한 라벨을 생성하는 문제를 해결하기 위해, 대조적 예시(contrastive examples)를 활용하는 방법을 제안합니다. 연구진은 VLM과 CLIP 기반의 Contrastive Semantic Projection (CSP)이라는 두 단계 접근 방식을 통해 뉴런 수준에서 충실도와 의미적 세분화를 모두 개선했음을 입증했습니다.

neuron-labelinginterpretabilitycontrastive-learning
4월 27일5
arXiv논문

품질 기반 선택적 변이: 딥러닝을 위한 접근법

본 연구는 딥러닝(DL) 테스트 및 디버깅에서 '변이'를 활용하는 방식을 개선하기 위해 품질 기반 선택적 변이 접근법을 제안합니다. 이 방법은 변이가 가지는 두 가지 역할, 즉 (1) 테스트 목표로서의 저항성과 (2) 실제 결함 시뮬레이션으로서의 현실성을 모두 포착하여 변이의 품질을 정량화하는 확률적 프레임워크를 제시합니다. 실험 결과, 이 접근법은 기존 방식 대비 변이 생성 비용을 크게 줄이면서도 두 가지 역할에 대한 높은 수준의 유용성을 유지할 수 있음을 입증했습니다.

deep-learningtest-generationmutation
4월 27일5
arXiv논문

호흡 공기류의 시간 국소화 파라메트릭 분해: 서브-회색 분석을 위한 접근

본 연구는 기존의 전역적 분석 방법으로는 포착하기 어려웠던 개별 호흡 내의 미세한 시간 국소화된 공기류 패턴(서브-회색 이벤트)을 특성화하는 새로운 파라메트릭 프레임워크를 제안합니다. 이 접근법은 생리학적으로 기반한 기본 함수들을 사용하여 흡입 공기류 신호를 진폭, 시작 시간, 지속 시간을 가진 소수의 성분으로 분해하며, 제한된 비선형 최적화를 통해 호흡 내의 파형 형태학을 정밀하게 모델링합니다. 실험 결과, 이 방법은 높은 재구성 정확도와 견고한 파라메트릭 정밀도를 보여주었으며, 특히 인지 피로 상태를 분류하는 데 있어 기존 대비 최대 30.7% 성능 향상을 입증하여 호흡 운동 조절에 대한 해석 가능하고 정량적인 기반을 제공합니다.

respiratory-airflowparametric-decompositiontime-localization
4월 27일3
arXiv논문

SOC-ICNN: 선형 계획법에서 이차원뿔 기하학으로 볼록 근사 함수 학습

본 논문은 기존의 ReLU 기반 입력 볼록 신경망(ICNN)이 선형 계획법(LP)에 국한되어 표현력에 한계가 있다는 점을 지적하고, 이를 극복하기 위해 이차원뿔 계획법(SOCP)으로 일반화된 아키텍처인 SOC-ICNN을 제안합니다. SOC-ICNN은 원뿔 기본 요소를 도입하여 함수 근사에 매끄러운 곡률을 추가하면서도 엄밀한 최적화 이론적 해석을 유지하며, 기존 ICNN보다 표현 공간을 확장시키면서도 계산 복잡도를 증가시키지 않음을 증명했습니다.

convex-optimizationneural-networkssocp
4월 27일1
arXiv논문

분포 외 탐지 및 일반화를 위한 신경 활성화 커버리지 재검토

본 기사는 분포 외 탐지(OOD detection) 및 일반화에 사용되는 신경 활성화 커버리지(NAC)라는 기술을 다루고 있습니다. 연구진은 이 NAC 기반의 접근 방식을 회귀 도메인에서 불확실성 추정 기술로 확장했으며, 그 결과를 통해 NAC가 몬테카를로 드롭아웃과 같은 기존 방법론보다 더 신뢰할 수 있는 불확실성 점수를 제공함을 입증했습니다.

out-of-distributionuncertainty-estimationneural-networks
4월 27일2
arXiv논문

핵심 요소만 선택: 커널 릿지 회귀를 위한 적응형 사전 학습 (Adaptive Dictionary Learning)

본 기술 기사는 커널 릿지 회귀(KRR)의 주요 문제점인 $O(n^2)$의 메모리 요구 사항을 해결하는 방법을 다룹니다. 기존의 Nystrom 근사법은 샘플링 방식에 따라 정확도와 공간 복잡도 사이에서 트레이드오프가 존재합니다. 본 논문에서는 INK-Estimate 알고리즘을 기반으로, 정규화되지 않은 릿지 레버리지 점수(unnormalized RLS)를 사용하는 새로운 방법인 SQUEAK을 제안합니다. 이 SQUEAK 알고리즘은 구현이 간결하고 유효 차원 추정 과정 없이도 기존의 정확한 샘플링 방식과 유사한 공간 복잡도를 달성할 수 있습니다.

kernel ridge regressionnystrom approximationdictionary learning
4월 27일2
arXiv논문

유연한 거부 샘플링 (Pliable Rejection Sampling)

본 논문은 어려운 분포에서 효율적으로 샘플을 추출하기 위한 새로운 기법인 유연한 거부 샘플링(Pliable Rejection Sampling, PRS)을 제안한다. 기존 거부 샘플링의 높은 거부율 문제를 해결하고, 커널 추정자를 사용하여 샘플링 제안을 학습하는 것이 특징이다. 이 방법은 얻어진 샘플들이 i.i.d.이며 특정 분포를 따르고, 수용된 샘플 개수에 대한 성능 보장까지 제공한다.

rejection-samplingsampling-methodskernel-estimation
4월 27일3
arXiv논문

Conformalized Super Learner

본 논문은 Super Learner(SL)와 Conformal Prediction(CP) 프레임워크를 결합하여 예측 성능과 유효한 구간 커버리지를 모두 확보하는 방법을 제안합니다. 기존 SL 기반 구간 예측 방법들이 점근적 가정이나 계산 집약적인 절차에 의존했던 한계를 극복하고, 개별 학습기 가중치를 사용하여 자연스럽게 CP와 SL을 결합했습니다. 이 접근법은 교환 가능성 위반, 이분산성, 희소성 등 복잡한 데이터 분포의 다양한 형태에서 경쟁력 있는 성능과 유효한 유한 표본 커버리지를 입증합니다.

conformal-predictionsuper-learnerensemble-methods
4월 27일2
arXiv논문

힌지 손실과 L1 노름의 혼합 거리를 활용한 강건한 퍼지 로컬 k-평면 클러스터링

본 논문은 기존 K-평면 클러스터링(KPC) 모델이 L2 거리를 가정하여 이상치에 취약하다는 문제를 해결하기 위해 새로운 강건한 퍼지 로컬 k-평면 클러스터링(RFLkPC) 방법을 제안합니다. RFLkPC는 힌지 손실과 L1 노름의 혼합 거리를 결합하고, 각 평면 클러스터가 유한 영역에 제한된다고 가정하여 강건성을 높였습니다. 이 방법은 이상치 처리와 성능 면에서 기존 모델들보다 우수함을 실험적으로 입증했습니다.

k-plane-clusteringfuzzy-clusteringrobustness
4월 27일3
arXiv논문

그래프 트랜스포머에서의 거리 불일치 학습과 적응형 그래프 인식 제어

본 논문은 그래프 트랜스포머가 직면하는 '거리 불일치' 문제를 다루며, 이는 작업의 특성(지역적 상호작용 vs. 장거리 통신)에 따라 모델이 필요로 하는 정보 전달 거리가 달라지기 때문에 발생합니다. 연구진은 합성 노드 분류 벤치마크를 통해 거리 불일치를 정의하고, 오라클 적응형 컨트롤러가 작업 측의 거리 목표에 접근할 때 가장 우수한 성능을 보임을 입증했습니다. 이는 그래프 인식 제어(graph-aware control) 설계 시 단순히 모델 구조만 조정하는 것이 아니라, 작업 특성에 맞는 '제어 목표'를 명시적으로 설정하는 것이 중요함을 보여줍니다.

graph-transformersgraph-attentionnode-classification
4월 27일2
arXiv논문

From Local to Cluster: A Unified Framework for Causal Discovery with Latent Variables

본 논문은 잠재 변수가 존재하는 환경에서 지역적(local) 구조 학습의 한계와 클러스터 수준 분석의 제약을 극복하는 통합 프레임워크인 L2C (Local to Cluster Causal Abstraction)를 제안합니다. L2C는 지역적 인과 패턴을 자동으로 파티션하고, 클러스터 축소 정리를 활용하여 인과 정보 손실 없이 노드를 축소합니다. 이를 통해 잠재 변수 환경에서도 인과 충분성을 가정하지 않고 미시적 및 거시적 수준의 인과 관계를 모두 포착하는 통합적인 접근 방식을 제공합니다.

causal-discoverylatent-variablesstructural-equation-models
4월 27일1
arXiv논문

Manifold-Aware Expert Evolution 을 통한 적응형 연속 모델 병합으로

본 논문은 기존 연속 모델 병합(CMM)의 한계점인 파라미터 포화 및 표현 간섭 문제를 해결하기 위해 MADE-IT라는 적응형 CMM 방법을 제안합니다. MADE-IT는 다양체 기하학을 기반으로 전문가 관리와 활성화를 조율하며, 분포 인식적 임계값 메커니즘과 서브스페이스 친밀도 계량을 활용하여 자율적인 전문가 진화를 유도합니다. 또한 데이터 및 학습 과정 없이 특징-서브스페이스 정렬을 통해 전문가를 활성화하는 효율적인 라우팅 메커니즘을 제시함으로써, 장기 시퀀스 작업에서 높은 정확도와 견고성을 입증했습니다.

continual learningmodel mergingmixture-of-experts
4월 27일3
arXiv논문

모든 시선이 워크플로우로: 비디오 스트림으로부터 자동화되고 효율적인 이벤트 발견

본 연구는 비디오 스트림과 같은 다중 모달리티 데이터에서 이벤트 데이터를 자동으로 추출하고 효율적으로 처리하는 'SnapLog'라는 접근법을 제안합니다. 이 방법은 이미지 임베딩을 사용하여 비디오 프레임을 특징 벡터로 변환하고, 시간적 유사도 분석을 통해 비디오를 세그먼트로 분할하여 이벤트 데이터를 생성합니다. 이렇게 추출된 구조화된 로그는 기존의 프로세스 마이닝 기법으로 활용되어 비즈니스 프로세스에 대한 깊은 통찰력을 제공할 수 있습니다.

video-analysisprocess-miningmulti-modality
4월 27일1
arXiv논문

FedSPDnet: Stiefel 제약 조건을 가진 대칭 양의 정부호 (SPD) 행렬에서 작동하는 고전적 SPDnet 모델에 대한 기하구조 인식 연방 딥러닝

FedSPDnet은 Stiefel 제약 조건을 가진 대칭 양의 정부호(SPD) 행렬에 작동하는 고전적 SPDnet 모델을 위한 두 가지 연방 학습 프레임워크를 제시합니다. 이 접근 방식은 표준 유클리드 평균화 대신 ProjAvg와 RLAvg라는 기하구조 보존 집계 전략을 사용하여 직교성을 유지하며, 계산 효율성과 옵티마이저 독립성을 확보했습니다. 시뮬레이션 결과, FedSPDnet은 EEG 운동 상상 벤치마크에서 기존의 연방 모델보다 우수한 성능과 견고성을 보여주었습니다.

federated-learningspd-matricesstiefel-manifold
4월 27일1
arXiv논문

이타콘산 생산 시뮬레이션을 위한 모델 보정 딥러닝

본 연구는 실제 배치 실험 데이터를 활용하여 이타콘산(itaconic acid) 생산을 위한 속도론적 파라미터를 추정하는 모델링에 딥러닝을 적용했습니다. 특히, 직접 딥러닝(DDL)과 생성형 조건부 흐름 매칭(CFM) 두 가지 전략을 비교한 결과, CFM이 비선형 회귀 기반의 벤치마크보다 더 높은 정확도와 일관성을 보였습니다. 이러한 결과는 CFM이 다양한 운전 조건 및 규모 확대 과정에서도 우수한 일반화 성능과 견고성을 제공함을 입증했습니다.

deep-learningbioprocessitaconic-acid
4월 27일1
arXiv논문

설명 가능하고 공정하며 관찰 가능한 병원 재입원 예측을 위한 통합 프레임워크: MIMIC-IV 데이터베이스를 통한 개발 및 검증

본 논문은 병원 재입원 예측 모델의 임상적 적용을 가로막는 설명 가능성, 배포 신뢰성, 공정성 문제를 해결하기 위한 통합 프레임워크를 제안합니다. MIMIC-IV 데이터베이스를 사용하여 훈련된 이 프레임워크는 XGBoost와 LightGBM 같은 고급 머신러닝 모델을 활용하여 높은 예측 성능(AUC-ROC 0.696)을 달성했습니다. 특히 SHAP 값을 이용한 환자별 설명과 다양한 하위 그룹에 대한 공정성 평가를 통해 임상 현장에서 신뢰할 수 있는 솔루션을 제공함을 입증했습니다.

medical-aireadmission-predictionexplainable-ai
4월 27일2

이 피드 구독하기

본 페이지의 콘텐츠는 AI가 공개된 소스를 기반으로 자동 수집·요약·번역한 것입니다. 원 저작권은 각 원저작자에게 있으며, 각 게시물의 “원문 바로가기” 링크를 통해 원문을 확인할 수 있습니다. 저작권자의 삭제 요청이 있을 경우 신속히 조치합니다.