본문으로 건너뛰기

© 2026 Molayo

Insights

AI가 자동으로 큐레이션·번역·정리하는 기술 동향 피드입니다.

arXiv cs.LG 272필터 해제

arXiv중요논문

자연 시스템 디지털 트윈 모델 적응을 위한 GFlowNet 활용 방안

본 논문은 시간이 지남에 따라 변화하고, 부분적으로만 관측되며, 매개체 시뮬레이터(mechanistic simulators)로 모델링되는 자연 시스템의 디지털 트윈(Digital Twin)을 위한 모델 적응(model adaptation) 문제를 다룹니다. 기존 방식으로는 희소하고 간접적인 관측 데이터 때문에 유일한 최적의 보정값(calibration)을 찾기 어렵다는 한계가 있었습니다. 이를 해결하기 위해, 저자들은 GFlowNet 기반 접근 방식을 제안합니다. 이 방법은 모델 적응 문제를 완전한 시뮬레이터 설정에 대한 생성 모델

digital-twingflownetmodel-adaptation
4월 23일1
arXiv논문

미래 정책을 활용한 강화학습 최적화 (NPO)

본 논문은 강화학습(RL)의 성능 향상을 위해 '근접 미래 정책 최적화(NPO)'라는 새로운 혼합 정책 기법을 제안합니다. 기존 방법들이 외부 교사나 과거 궤적에 의존하여 발생하는 분포 차이 또는 품질 한계 문제를 해결하고자 합니다. NPO는 현재 학습 중인 정책의 '근접한 미래 시점 체크포인트'를 활용하여 보조 궤적을 생성하며, 이는 현재 정책보다 강력하면서도 외부 소스보다 가까운 장점을 가집니다. 이를 통해 효과적인 학습 신호 $\mathcal{S} = Q/V$를 극대화하고, 실제 모델(Qwen3-VL-8B-Instruct)에서

reinforcement learningrlvrpolicy optimization
4월 23일1
arXiv중요논문

시뮬레이션 기반 추론(SBI)을 활용한 실시간 장비 상태 모니터링

산업 설비의 정확한 상태 진단은 불확실성 하에서 간접 센서 측정값으로부터 잠재적인 열화 매개변수를 추론하는 것을 필요로 합니다. 기존의 MCMC 기반 베이즈 방법은 계산 비용이 높아 실시간 적용에 한계가 있었습니다. 본 논문은 이를 해결하기 위해 시뮬레이션 기반 추론(SBI)을 제안합니다. SBI는 신경망 밀도 추정기(neural density estimators)를 사용하여 열-유체 관측값에서 열화 매개변수의 전체 사후 분포로 직접적인 매핑을 학습합니다. 이 접근법은 기존 MCMC 대비 진단 정확도를 유지하면서 추론 시간을 82배

bayesiansbimachine learning
4월 23일1
arXiv중요논문

F²LP-AP: 적응형 커널을 활용한 빠르고 유연한 레이블 전파 기법

본 논문은 그래프 머신러닝의 핵심 과제인 준지도 노드 분류(Semi-supervised node classification)를 위한 새로운 프레임워크, F²LP-AP를 제안합니다. 기존 GNN들은 높은 계산 비용과 강한 동종성(homophily) 가정에 의존하는 한계가 있습니다. 반면, 레이블 전파(Label Propagation) 같은 비학습 방식은 이질적 그래프 구조(heterophilous graph)에 적응성이 떨어집니다. F²LP-AP는 계산 효율적인 학습 없는(training-free) 방식으로, 기하 평균점(geodes

graph-machine-learninggnnlabel-propagation
4월 23일1
arXiv중요논문

자율 시스템을 위한 생애주기 인식 연합 지속 학습 (FCL) 프레임워크

본 논문은 이동형 자율 시스템(Mobile Autonomous Systems)이 장기간 임무를 수행하며 변화하는 환경에 적응할 수 있도록 '생애주기 인식 연합 지속 학습 (FCL)' 프레임워크를 제안합니다. 기존 FCL 방법론의 한계점인 획일적인 보호 전략, 누적 드리프트(cumulative drift) 문제 미해결, 실제 환경 반영 부족 등의 문제를 해결했습니다. 이 프레임워크는 로컬 학습 시 즉각적인 망각 방지(pre-forgetting prevention)와 장기적인 성능 저하 후 회복(post-forgetting)이라는 두

federated learningcontinual learningautonomous systems
4월 23일1
arXiv중요논문

운전자 행동 및 지도 데이터를 결합한 개인화된 전기차 에너지 소비 예측 프레임워크

본 논문은 지리 정보(map-based contextual features)와 운전 습관을 통합하여 배터리 전기차(BEV)의 에너지 소비를 개인화하여 추정하는 프레임워크를 제시합니다. 이 시스템은 경로 선택, 도로 특징 처리, 규칙 기반 속도 생성기, 그리고 PID 제어기를 이용한 차량 동역학 시뮬레이터를 결합했습니다. 여기에 개별 운전 패턴을 학습한 Bidirectional LSTM 모델이 통합되어 정확한 개인별 속도 프로파일을 예측합니다. 이러한 예측된 속도와 지도 기반의 에너지 소비 모델(quasi-steady backward

bevenergy_consumptionlstm
4월 23일1
arXiv중요논문

함수 공간에서 상대 엔트로피 추정: 궤적 추론의 새로운 기준 제시

본 논문은 단일 세포 유전체학(single-cell genomics)과 같은 부분 관측 환경에서 발생하는 궤적 추론(Trajectory Inference, TI) 문제를 다룹니다. 기존 방법들이 제한적인 주변 분포 예측에 의존했던 한계를 극복하기 위해, 함수 공간상의 확률 측도 간의 Kullback-Leibler (KL) 발산을 추정하는 일반적인 프레임워크를 제안합니다. 이 데이터 기반 추정기는 실제 스냅샷 데이터셋에도 확장 가능하며, 기존 평가 지표들이 일관성 없는 결과를 내는 반면, 함수 공간 KL은 궤적 추론 방법론을 비교하고

trajectory inferencefunctional klkullback-leibler divergence
4월 23일1
arXiv중요논문

사용자 학습을 고려한 장기 효과 및 생애 가치 추정 방법론

스트리밍 플랫폼에서 발생하는 이탈(churn)은 비용이 크지만, 기존의 A/B 테스트는 제한된 실험 기간 내 결과만을 측정하는 한계가 있습니다. 본 논문은 사용자 학습 효과를 통합하여 장기 치료 효과(Long-Term Treatment Effects, LTE)와 잔여 생애 가치 변화($ΔERLV$)를 효율적으로 추정하는 새로운 방법을 제안합니다. 다중 코호트 데이터를 결합한 역분산 가중 추정량(inverse-variance weighted estimator)을 사용하여 분산을 줄였으며, 이를 통해 단기적 효과와 장기적인 사용자 잔여

ab_testinglifetime_valueuser_learning
4월 23일1
arXiv중요논문

격자 게이지 이론을 위한 게이지 등변 그래프 신경망 (GNN)

본 논문은 국소 게이지 대칭성(local gauge symmetry)이 지배하는 양자 물질 및 기본 상호작용 시스템을 위한 새로운 접근 방식을 제시합니다. 기존 ML 방법론들이 사이트 의존적(site-dependent) 대칭성을 처리하는 데 어려움을 겪었던 문제를 해결하고자, 메시지 전달 과정에 비가환(non-Abelian) 대칭성을 직접 통합한 게이지 등변 그래프 신경망을 제안했습니다. 이 모델은 국소 연산만으로도 격자 전체의 비국소 상관관계(nonlocal correlations)와 루프 구조를 자연스럽게 학습할 수 있게 하여,

gauge theorygraph neural networkquantum matter
4월 23일1
arXiv중요논문

LEXIS: 이미지 기반 3D 인간-사물 상호작용 복원 모델

본 논문은 RGB 이미지를 통해 3차원(3D)의 인간-사물 상호작용(Human-Object Interaction, HOI)을 복원하는 문제를 다룹니다. 기존 방식이 간헐적인 접촉 신호에 의존하여 자연스러운 연속적 근접성을 포착하지 못했던 한계를 극복하고자 했습니다. 연구진은 'InterFields'라는 개념을 도입하여 몸과 사물 표면 전체의 밀도 높은 연속적 근접도를 인코딩하고, 이를 VQ-VAE를 통해 학습한 이산 매니폴드인 'LEXIS'로 구조화했습니다. 최종적으로 LEXIS 시그니처를 활용하는 확산 모델(Diffusion) 프

3d-reconstructionhoidiffusion-model
4월 23일1
arXiv중요논문

ParetoSlider: 다중 목표 RL로 확산 모델의 제어 가능성 극대화

기존 강화학습(RL) 기반 생성 모델 정렬 방식은 단일 스칼라 보상에 의존하여, 여러 상충하는 목표(예: 프롬프트 준수 vs. 소스 충실도) 간의 트레이드오프를 고정된 가중치 합으로 처리합니다. 저희가 제안하는 ParetoSlider는 다중 목표 RL (MORL) 프레임워크로, 단일 확산 모델이 전체 파레토 전선(Pareto front)을 근사하도록 학습시킵니다. 이 방식을 통해 사용자는 추론 시점에 별도의 재학습이나 여러 체크포인트 관리 없이도 다양한 선호도 가중치를 조건부 신호로 주입하여 최적의 트레이드오프를 연속적으로 탐색할수

diffusion modelsreinforcement learningmorl
4월 23일1
arXiv중요논문

생의학 영상 데이터의 도메인 갭 해소: CS-ARM-BN 제안

본 논문은 생의학 영상 분석에서 치명적인 문제인 '배치 효과(batch effects)'를 해결하는 새로운 방법론, CS-ARM-BN을 제안합니다. 배치 효과는 실험 재현성을 떨어뜨리고 기존 딥러닝 모델이 실제 환경(새로운 배치)에서 실패하는 주원인입니다. 연구진은 메타 학습 기반의 적응 방식을 사용하여 '부정적 제어 샘플(negative control samples)'이라는 항상 존재하는 안정적인 컨텍스트를 활용합니다. 대규모 JUMP-CP 데이터셋을 사용한 MoA 분류 실험 결과, 기존 ResNet 모델의 정확도가 훈련 도메인(

biomedical imagingdomain shiftmeta-learning
4월 23일1

이 피드 구독하기

본 페이지의 콘텐츠는 AI가 공개된 소스를 기반으로 자동 수집·요약·번역한 것입니다. 원 저작권은 각 원저작자에게 있으며, 각 게시물의 “원문 바로가기” 링크를 통해 원문을 확인할 수 있습니다. 저작권자의 삭제 요청이 있을 경우 신속히 조치합니다.