Insights
AI가 자동으로 큐레이션·번역·정리하는 기술 동향 피드입니다.
arXiv cs.LG 2125건필터 해제
Extreme bandits
본 논문은 의학, 보안 등 다양한 분야에서 제한된 자원을 여러 출처에 순차적으로 할당할 때, 단순히 평균 보상을 최대화하는 것을 넘어 가장 극단적인 값(outlier)을 탐지하는 효율적인 방법을 연구합니다. 기존 밴디트 이론이 주로 '최대 평균 보상'의 후회(regret)를 다루는 것과 달리, 본 연구에서는 출처가 출력한 가장 극단적인 값을 탐지하는 데 초점을 맞춘 '극단적 후회(extreme regret)' 개념을 도입합니다. 이를 위해 ExtremeHunter라는 새로운 알고리즘을 제안하고, 이론적 분석 및 실제 세계 실험을 통해 그 성능을 검증했습니다.
장기 전자의무기록을 활용한 급성신부전 환자의 신중독 위험 예측 및 치료 효과 추정
본 연구는 장기 전자의무기록(EHR)을 활용하여 급성신부전 환자에게서의 신중독 위험을 예측하고, 특정 약물 노출이 치료 효과에 미치는 영향을 추정하는 모델을 개발했습니다. 9만 명 이상의 대규모 코호트를 사용하여 진단, 수술, 약물 시퀀스를 모델링했으며, 트랜스포머 기반 인과 다중 헤드 모델을 통해 약물의 평균 치료 효과(ATEs)를 계산했습니다. 분석 결과, ACE/ARB 계열 약물 노출은 부분적인 보호 경향을 보인 반면, 루프 이뇨제는 신장 기능 악화와 관련된 위험 신호를 제시하여 임상적 의사결정에 중요한 근거를 제공합니다.
GSC-QEMit: 시간 변화 노이즈에 대응하는 적응형 양자 오류 완화를 위한 계층적 예측-밴디트 프레임워크
GSC-QEMit은 시간 변화하는 노이즈 환경에서 양자 오류 완화(QEM)의 효율성을 높이기 위해 설계된 적응형 프레임워크입니다. 이 시스템은 스트리밍 원격 탐사 데이터를 분석하여 운영 컨텍스트를 파악하고, 가우시안 프로세스를 통해 단기 충실도 저하를 예측하며, 비용을 고려한 다팔밴디트(MAB)를 사용하여 최적의 완화 행동을 결정합니다. 실험 결과, GSC-QEMit은 비정상적인 노이즈 환경에서도 논리 충실도를 크게 향상시키면서 불필요한 개입을 줄여 우수한 트레이드오프 성능을 입증했습니다.
사이드 관측이 있는 밴디트 문제에서의 암묵적 탐색을 통한 효율적 학습
본 논문은 학습자가 완전한 정보가 아닌, 일부 행동의 손실만 관측할 수 있는 부분 관측성(partial observability) 온라인 학습 문제를 다룹니다. 저자들은 이러한 환경에서 근사 최적의 후회 보증을 제공하는 새로운 알고리즘 두 가지를 제안합니다. 이 알고리즘들은 '암묵적 탐색(implicit exploration)'이라는 효율적인 전략에 의존하며, 이는 기존 연구 대비 계산적 및 정보 이론적으로 더 우수함을 입증했습니다.
등변성 기계 학습 밀도를 통한 분자 동역학 강화
본 논문은 기계 학습 원자간 퍼텐셜(MLIPs)의 한계를 극복하고, 쌍극자 모멘트와 분극률 같은 전자 관측량까지 접근 가능한 '밀도 우선(density-first)' 기계 학습 전자 구조 접근법인 DenSNet을 제안합니다. DenSNet은 SE(3)-등변성 신경망과 $\Delta$-학습 전략을 결합하여 원자 중심 가우스 기저의 밀도 계수를 예측하고, 이를 총 에너지로 매핑함으로써 분자 동역학과 전자 구조를 통합적으로 다룰 수 있는 프레임워크를 제공합니다. 이 방법은 에탄올 및 폴리티오펜 올리고머와 같은 시스템에서 실험적 스펙트럼과 일치하는 안정적인 장기 궤적을 성공적으로 생성하여, 대규모 분자 시뮬레이션의 예측 가능성을 크게 향상시킵니다.
공간 - 시간 그래프 신경망을 활용한 암호화폐 시장 사기 탐지
본 논문은 암호화폐 시장의 사기 거래를 탐지하기 위해 공간-시간 그래프 신경망(STGNN)을 활용하는 방법을 제안합니다. 기존 방식이 개별 자산과 거래를 독립적으로 처리했던 것과 달리, 이 방법론은 시장 조작이 관계적 구조와 시간적 패턴에 의존한다는 점에 착안하여, 주의 기반 공간 집계와 시간적 Transformer 인코딩을 결합한 통합 그래프 아키텍처를 사용합니다. 실제 데이터셋 평가 결과, 제안된 그래프 기반 모델이 기존의 표준 기계 학습 방식보다 시장 조작 스킴 탐지에서 유의미하게 높은 성능을 보였습니다.
비선형 관측을 갖는 선형 시스템에 대한 이중 제어와 신뢰 공간 모델 예측 제어
본 논문은 비선형 관측(bilinear observations)을 갖는 선형 시스템의 유한 시간 구간 이차 제어 문제를 다룹니다. 기존의 분리 원리가 실패할 수 있는 이 설정에서, 상태 추정에는 입력 의존성 칼만 필터가 필요합니다. 이를 해결하기 위해, 연구진은 신뢰 공간 모델 예측 제어(B-MPC)를 제안하며, 이는 입력 의존적 칼만 필터에 의해 정의된 신뢰 진화의 결정론적 대리자를 사용하여 상태와 오차 공분산을 직접 계획함으로써 기존 방법보다 우수한 성능을 입증했습니다.
위상 공간 위의 연속 함수 집합의 전집과 공전집을 이용한 근접 집계 딥러닝에 대한 함자적 서술
본 논문은 위상 공간 위의 연속 함수 집합의 전집과 공전집 개념을 도입하여 합성곱 및 메시지 전달 신경망에 대한 수학적 해석을 제공한다. 이를 통해, 이러한 구조가 가지는 함자적(functorial) 특성을 분석하고, 전집이나 공전집이 되기 위한 장애물(obstructions)을 활용함으로써 기존 신경망 모델의 경험적인 한계를 심화하는 이론적 휴리스틱을 제시한다.
유방암 생존 예측을 위한 병리 기반 모델 벤치마킹
본 연구는 전체 슬라이드 조직병리 이미지로부터 유방암 생존 예측을 위해 다양한 병리 기반 모델(PFMs)들을 벤치마킹했습니다. 표준화된 파이프라인과 세 개의 독립적인 임상 코호트를 사용하여 모델의 일반화 능력을 엄격하게 검증했으며, 그 결과 H-optimus-1 모델이 가장 우수한 생존 예측 성능을 보였습니다. 또한, 컴팩트한 디스틸드 모델인 H0-mini가 더 큰 스터디어 모델보다 유사하거나 약간 나은 성능을 보이면서 효율적인 임상 배포의 실질적인 지침을 제시했습니다.
Energy-Arena: 운영 에너지 예측을 위한 동적 벤치마크
Energy-Arena는 운영 에너지 시계열 예측 분야의 지속적인 비교 가능성 격차를 해결하기 위해 설계된 동적 벤치마킹 플랫폼입니다. 기존 연구들이 특정 데이터셋과 조건에 국한되어 있어 직접적인 성능 비교가 어려웠던 문제를 해결하며, 이 플랫폼은 실시간으로 업데이트되는 참조점을 제공합니다. API 기반 제출 시스템과 지속 가능한 리더보드를 통해 전향적(forward-looking) 벤치마킹을 수행함으로써 투명성을 높이고 모델의 실제 운영 능력을 평가할 수 있게 합니다.
차분 평탄성을 활용한 제한된 다중 입력 제어 아핀 시스템의 효율적인 학습 기반 모델 예측 제어
본 논문은 로봇 시스템의 불확실성을 다루는 학습 기반 제어 기술의 계산적 비효율성 문제를 해결하기 위해 차분 평탄성(differential flatness) 성질을 활용한 새로운 모델 예측 제어 기법을 제안합니다. 이 방법은 일반적인 다중 입력 비선형 아핀 시스템에 적용 가능하며, 블록 대각 비용 함수와 시스템 확장을 사용하여 효율성을 높였습니다. 또한, 두 번의 순차적 볼록 최적화만으로 확률적 라이아푸노프 감소를 보장하여 높은 성능과 실용성을 입증했습니다.
SpecRLBench: 명세 지향 강화학습의 일반화 성능을 위한 벤치마크
본 논문은 명세 지향 강화학습(Specification-guided reinforcement learning, RL)의 일반화 성능을 체계적으로 평가하기 위해 SpecRLBench라는 새로운 벤치마크를 소개합니다. 이 벤치마크는 항행 및 조작 도메인을 포괄하며, 정적/동적 환경, 다양한 로봇 역학, 여러 관측 모달리티 등 다채로운 난이도와 복잡성을 포함하고 있습니다. SpecRLBench는 기존 방법론들의 강점과 한계를 명확히 규명하고, 향후 더 일반화 가능한 RL 연구 개발을 위한 구조화된 플랫폼을 제공하는 것을 목표로 합니다.
다항식 분류와 리스트 학습의 최적 표본 복잡도
이 기술 기사는 이진 분류에서 다항식 분류와 리스트 학습의 최적 표본 복잡도(sample complexity)를 결정하는 문제를 다룹니다. 기존에는 다항식 분류의 정확한 복잡도 파라미터가 미해결 상태였으나, 최근 연구를 통해 모든 다항식 가설 클래스의 최대 하이퍼그래프 밀도가 $DS$ 차원 이하임을 증명했습니다. 이 결과는 오랜 추측을 입증하며, 다항식 분류와 리스트 학습 모두에 대한 최적 표본 복잡도 의존성을 확립하는 중요한 진전입니다.
리만 기하학적 특징과 RNN 을 활용한 고차원 손가락 운동 디코딩
본 논문은 근전도(EMG) 신호를 활용하여 고차원 손가락 운동학을 연속적으로 추정하는 엔드투엔드 프레임워크를 제시합니다. 기존의 분류 기반 방식이 가진 자유도 제한 문제를 해결하기 위해, 연구진은 8채널 EMG와 손가락 관절 각도를 포함한 대규모 데이터셋(EMG-FK)을 구축했습니다. 핵심 모델인 Temporal Riemannian Regressor (TRR)는 리만 기하학적 특징과 GRU를 결합하여 운동 디코딩의 정확도와 실시간성을 모두 높였으며, 이는 임베디드 시스템에서의 자연스러운 제어 구현 가능성을 입증합니다.
전국적 일본 의료 청구 기반 모델: 모델 스케일링과 작업별 계산 효율성의 균형
본 연구는 전국 일본 병원 청구 데이터를 활용하여 구조화된 의료 데이터에 대한 모델 스케일링 법칙을 탐구했습니다. 5가지 크기의 인코더 전용 트랜스포머를 사전 훈련하고 질병 및 약물 예측과 같은 다운스트림 작업을 평가한 결과, 모델의 최적 크기가 작업 특성에 따라 다르게 나타났습니다. 특히, 질병 예측은 더 큰 모델에서 이득을 얻었으나, 약물 예측은 비교적 작은 규모(1100만 파라미터)에서 성능이 포화되어 계산 효율성을 크게 개선할 수 있음을 보여주었습니다.
연속 학습에서 Adam 을 위한 경량 수정의 숨겨진 실패 모드와 적응적 디커플링 모멘트 라우팅을 통한 복구
본 논문은 연속 학습(Continual Learning)에서 Adam 최적화기를 사용하는 여러 기법들이 숨겨진 실패 모드를 가지고 있음을 보여줍니다. 특히 고중첩 환경에서 공유 라우팅 투영 기반의 방법들은 성능이 크게 저하되는 경향을 보입니다. 연구진은 이 문제를 Adam의 2차 모멘트 경로가 이전 방향의 유효 학습률에 과도한 확장을 유도하기 때문임을 밝혀냈으며, 이를 해결하기 위해 수정된 기울기를 1차 모멘트에만 라우팅하고 적응적 디커플링 강도를 적용하는 새로운 방법을 제안했습니다. 이 방법은 기존 방식들이 실패했던 다양한 설정에서 안정적인 성능 개선을 입증했습니다.
지표면 온도 너머: 설명 가능한 공간 기계 학습이 인간 중심 열 스트레스에 대한 도시 형태 영향 규명
본 연구는 기존의 지표면 온도(LST) 기반 접근 방식의 한계를 극복하고, 인간 중심의 생리학적 열 스트레스 지수인 보편적 열 기후 지수(UTCI)와 LST를 비교 분석하는 포괄적인 프레임워크를 제시합니다. 싱가포르 데이터를 활용하여 GPU 가속화된 1m UTCI와 Landsat 기반 30m LST의 공간적 차이를 모델링하고, XGBoost 및 GAM과 같은 설명 가능한 기계 학습 모델을 적용했습니다. 분석 결과, 하늘 시야 계수(sky view factor)가 UTCI 변동성을 주도하는 반면, LST는 인간 열 스트레스와 관련된 복사 과정을 충분히 포착하지 못한다는 점이 밝혀졌습니다. 이는 도시 계획 및 기후 적응형 위험 관리에 생리학적 관련성이 높은 지표를 통합해야 함을 시사합니다.
Contrastive Semantic Projection: Contrastive Examples 를 활용한 충실한 뉴런 라벨링
본 논문은 딥러닝 네트워크 내부 단위(뉴런)에 충실한 텍스트 설명을 할당하는 '뉴런 라벨링' 기법을 개선합니다. 기존 방식이 높은 활성화 예시에 의존하여 광범위하거나 부정확한 라벨을 생성하는 문제를 해결하기 위해, 대조적 예시(contrastive examples)를 활용하는 방법을 제안합니다. 연구진은 VLM과 CLIP 기반의 Contrastive Semantic Projection (CSP)이라는 두 단계 접근 방식을 통해 뉴런 수준에서 충실도와 의미적 세분화를 모두 개선했음을 입증했습니다.
품질 기반 선택적 변이: 딥러닝을 위한 접근법
본 연구는 딥러닝(DL) 테스트 및 디버깅에서 '변이'를 활용하는 방식을 개선하기 위해 품질 기반 선택적 변이 접근법을 제안합니다. 이 방법은 변이가 가지는 두 가지 역할, 즉 (1) 테스트 목표로서의 저항성과 (2) 실제 결함 시뮬레이션으로서의 현실성을 모두 포착하여 변이의 품질을 정량화하는 확률적 프레임워크를 제시합니다. 실험 결과, 이 접근법은 기존 방식 대비 변이 생성 비용을 크게 줄이면서도 두 가지 역할에 대한 높은 수준의 유용성을 유지할 수 있음을 입증했습니다.
호흡 공기류의 시간 국소화 파라메트릭 분해: 서브-회색 분석을 위한 접근
본 연구는 기존의 전역적 분석 방법으로는 포착하기 어려웠던 개별 호흡 내의 미세한 시간 국소화된 공기류 패턴(서브-회색 이벤트)을 특성화하는 새로운 파라메트릭 프레임워크를 제안합니다. 이 접근법은 생리학적으로 기반한 기본 함수들을 사용하여 흡입 공기류 신호를 진폭, 시작 시간, 지속 시간을 가진 소수의 성분으로 분해하며, 제한된 비선형 최적화를 통해 호흡 내의 파형 형태학을 정밀하게 모델링합니다. 실험 결과, 이 방법은 높은 재구성 정확도와 견고한 파라메트릭 정밀도를 보여주었으며, 특히 인지 피로 상태를 분류하는 데 있어 기존 대비 최대 30.7% 성능 향상을 입증하여 호흡 운동 조절에 대한 해석 가능하고 정량적인 기반을 제공합니다.
이 피드 구독하기
본 페이지의 콘텐츠는 AI가 공개된 소스를 기반으로 자동 수집·요약·번역한 것입니다. 원 저작권은 각 원저작자에게 있으며, 각 게시물의 “원문 바로가기” 링크를 통해 원문을 확인할 수 있습니다. 저작권자의 삭제 요청이 있을 경우 신속히 조치합니다.