© 2026 Molayo

Insights

AI가 자동으로 큐레이션·번역·정리하는 기술 동향 피드입니다.

arXiv cs.LG 1862건필터 해제

ActiveSAM: 빠르고 정확한 오픈 보카블러리 세그멘테이션을 위한 이미지 조건부 클래스 프루닝 (Image-Conditional Class

ActiveSAM은 SAM 3를 활용하여 오픈 보카블러리 시맨틱 세그멘테이션(OVSS)의 효율성을 극대화하는 제로샷 추론 프레임워크입니다. 이미지에 포함된 활성 클래스만을 선별하여 디코딩함으로써 속도와 정확도를 동시에 개선했습니다.

심층 신경망에서의 기울기 폭주 및 소실: 잔차 연결 (residual connections)의 효과

심층 신경망의 기울기 폭주 및 소실 문제를 곱셈적 에르고딕 이론을 통해 분석한 연구입니다. 잔차 연결(residual connection)이 리아푸노프 스펙트럼에 미치는 영향을 수학적으로 규명합니다.

TuneJury: 음악 생성 선호도 정렬(Preference Alignment) 개선을 위한 오픈 메트릭

음악 생성 모델의 선호도 정렬을 개선하기 위한 오픈 보상 모델인 TuneJury를 소개합니다. 인간의 미적 평가와 투표 데이터를 기반으로 학습되었으며, 다양한 다운스트림 애플리케이션에서 높은 성능과 데이터 효율성을 보여줍니다.

ROVE: 강화학습을 통한 휴머노이드 조작을 위한 인간 개입의 활용

ROVE는 불완전한 인간의 개입 데이터를 활용하여 휴머노이드 VLA 모델을 학습시키는 강화학습 프레임워크입니다. 낙관적 가치 추정(OVE)과 교차 체형 비디오를 통해 데이터의 품질 문제를 해결하고 정교한 조작 성능을 구현합니다.

토큰에서 정책으로: 인과적이고 해석 가능한 이질적 처치 효과 식별

이질적 처치 효과(HTE) 식별 시 발생하는 해석 가능성과 표현력 사이의 트레이드오프 문제를 해결하기 위한 연구입니다. 멀티모달 데이터를 활용해 잠재적 상호작용자를 포착하는 NEXIS 방법론을 제안하며, 실제 빈곤 퇴치 프로그램에 적용하여 그 효과를 검증했습니다.

그래프 네이티브 시계열을 위한 필터링된 컨포멀 타원체 (Filtered Conformal Ellipsoids)

다변량 시계열 예측을 위해 상태 공간 필터와 분할 컨포멀 보정을 결합한 '필터링된 컨포멀 타원체' 방법론을 제안합니다. 가우시안 분포 가정 없이도 학습된 공분산의 이점을 활용하며, 그래프 네이티브 데이터셋에서 기존 방식보다 정교한 예측 범위를 제공합니다.

ExpRL: LLM 미드 트레이닝(Mid-Training)을 위한 탐색적 강화학습 (Exploratory RL)

ExpRL은 LLM의 추론 능력 향상을 위해 탐색적 강화학습을 활용한 미드 트레이닝 기법을 제안합니다. 참조 데이터를 직접 모방하는 대신 보상 스캐폴드로 사용하여, 모델이 스스로 유용한 추론 경로를 탐색하고 조밀한 보상을 받도록 유도합니다.

당신의 프라이버시, 나의 망토: 차분 프라이버시 연합 학습(DP-FL)에 대한 백도어 공격

차분 프라이버시(DP)가 연합 학습(FL)의 백도어 공격 방어력을 높인다는 기존 가설을 반박하는 연구입니다. DP가 악성 업데이트의 통계적 특성을 가려 방어 기제를 무력화하는 '마스킹 효과'를 발견하고, 이를 악용하는 새로운 공격 방식인 RING을 제안합니다.

신경 표현(Neural Representations)에서 위상(Phase)의 중요성: 이미지 분류기에 대한 내부 Oppenheim-Lim 테스트

이미지 분류기의 은닉층에서 이미지의 정체성이 위상(Phase) 정보에 의존함을 입증하는 연구입니다. 실험을 통해 ViT와 GFNet 등 주요 모델이 크기(Magnitude)보다 위상 정보를 통해 정체성을 유지함을 확인했습니다.

희소한 에피소드 결과로부터 VLA의 온라인 RL 미세 조정을 위한 계층적 이득 가중치 부여 (Hierarchical Advantage

VLA 모델의 온라인 강화학습 미세 조정 시 발생하는 희소한 보상 문제를 해결하기 위해 계층적 이득 가중 행동 복제(HABC) 방법을 제안합니다. 생존 가능성과 효율성을 분리하여 학습하고 개입 인식 신용 할당을 통해 로봇 작업의 성공률을 크게 향상시켰습니다.

로봇 정책 학습을 위한 기하학적 행동 모델 (Geometric Action Model)

기하학적 파운데이션 모델(GFM)을 활용하여 로봇의 조작 성능을 높이는 기하학적 행동 모델(GAM)을 제안합니다. GAM은 GFM의 중간 레이어를 분할하여 미래의 기하학적 정보와 행동을 동시에 예측함으로써 3D 물리 세계에 최적화된 조작을 수행합니다.

선형 역문제(Linear Inverse Problems) 해결을 위한 정확한 사후 스코어 추정(Exact Posterior Score

확산 모델을 활용한 선형 역문제 해결을 위해 폐쇄형(closed form)으로 정확한 사후 스코어(EPS)를 유도하는 연구입니다. 기존의 근사 방식이나 추가 학습 없이도 표준 디노이저 구조를 유지하며 높은 성능을 구현합니다.

아티팩트를 넘어: 음악 고유 특징을 통한 일반화 가능한 합성곡 탐지(Synthetic Song Detection)를 향하여

음악 생성 기술의 발전에 대응하여, 특정 생성기에 의존하지 않고 음악 고유의 특징을 활용해 합성곡을 탐지하는 Sofia 프레임워크를 제안합니다. MoE 모듈을 통해 보컬, 오디오 효과, 전역 구조를 모델링하며, 새로운 벤치마크인 MUSIC8K를 통해 성능을 입증했습니다.

실수, 복소수 및 사원수 심층 선형 네트워크 (Deep Linear Networks)의 엔트로피 공식에 대하여

본 논문은 실수 심층 선형 네트워크(DLN)에 적용되던 기존 엔트로피 공식을 복소수 및 사원수 영역으로 확장하여, $\mathbb{R}$, $\mathbb{C}$, $\mathbb{H}$ 상의 DLN에 대한 통합된 공식을 도출하는 연구를 다룹니다.

토양 유기 탄소 (SOC) 예측을 위한 Mixture of Experts 기반 멀티모달 시공간 그래프 신경망

토양 유기 탄소(SOC) 예측을 위해 멀티모달 시공간 그래프 신경망인 SpTGNN을 제안합니다. 이 모델은 이종 그래프 어텐션과 MoE 모듈을 결합하여 분광 및 시공간 정보를 효과적으로 융합하며, 기존 머신러닝 모델보다 뛰어난 예측 성능을 보여줍니다.

인터페이스 파쇄 학습: 스프레이 형성을 위한 기하학 조건부 잠재 대리 모델 (A Geometry-Conditioned Latent

스프레이 노즐 설계를 위한 고충실도 CFD 시뮬레이션의 비용 문제를 해결하기 위해 기하학 조건부 잠재 대리 모델을 제안합니다. AMR 셀 밀도 필드를 인코딩하여 복잡한 2상 유동을 효율적으로 재구성하며, 기존 시뮬레이션 대비 압도적인 속도 향상을 달성했습니다.

영아의 자발적 움직임 노이즈가 심층 강화학습 (Deep RL)의 탐색을 개선한다

영아의 자발적 움직임 패턴에서 영감을 얻은 새로운 액션 노이즈 메커니즘을 통해 심층 강화학습(Deep RL)의 탐색 효율을 개선하는 연구입니다. 유색 소음(colored noise)의 시간적 자기상관을 활용하여 기존 백색 소음 방식보다 더 구조화된 탐색 행동을 생성합니다.

PhysGuard: Sim-to-Real 신경 PDE 대리 모델을 위한 Fisher 유도 그래디언트 투영 (Fisher-Guided

시뮬레이션과 실제 환경 간의 격차를 줄이기 위해 물리적 구조를 보존하며 미세 조정하는 PhysGuard 프레임워크를 제안합니다. Fisher 정보 행렬을 활용해 물리적으로 중요한 파라미터 방향을 식별하고, 이를 보호함으로써 신경 연산자의 성능 저하를 방지합니다.

무선 시스템의 CSI 압축을 위한 문맥 인식 마르코프 VAE (Context-Aware Markov VAE)

FDD 시스템의 Massive MIMO 채널을 위한 새로운 CSI 압축 프레임워크인 k-MMVAE를 제안합니다. 마르코프 구조를 활용해 CSI의 시간적 상관관계를 잠재 공간에서 모델링함으로써 압축 효율을 높였습니다.

TCHG: 신뢰할 수 있는 동적 신뢰 예측을 위한 삼중 신뢰 조건부 이종 그래프 학습

TCHG는 이종 신뢰 증거를 세 가지 채널로 분해하여 그래프 전파 과정을 제어하는 새로운 프레임워크입니다. 엔티티, 상호작용, 문맥적 신뢰를 독립적인 시간적 척도로 관리하여 신뢰 예측의 정확도와 신뢰도를 높입니다.

이 피드 구독하기

RSSFeedly, Inoreader 등으로 구독

API/api/search?q=검색어

AIllms.txt로 AI 크롤링 가이드

본 페이지의 콘텐츠는 AI가 공개된 소스를 기반으로 자동 수집·요약·번역한 것입니다. 원 저작권은 각 원저작자에게 있으며, 각 게시물의 “원문 바로가기” 링크를 통해 원문을 확인할 수 있습니다. 저작권자의 삭제 요청이 있을 경우 신속히 조치합니다.