Insights
AI가 자동으로 큐레이션·번역·정리하는 기술 동향 피드입니다.
arXiv cs.LG 1862건필터 해제
Simplex 제약 희소 배깅(SCSB): 균일 사전 분포에서 희소 사후 분포로의 전이
본 논문은 부트스트랩 기반 배깅 앙상블의 학습 후 압축 및 확률 보정을 위한 새로운 프레임워크인 Simplex-Constrained Sparse Bagging (SCSB)를 제안합니다. SCSB는 OOB 손실 최소화를 통해 결합 최적화 문제로 앙상블 가지치기 및 보정을 공식화하며, 오목한 이차 페널티를 도입하여 희소성을 유도합니다.
바흐 스타일의 기보 음악 생성 모델링: 자기회귀적, 잠재 변수 기반, 적대적 접근 방식 비교 연구
본 연구는 공유 MIDI 코퍼스를 활용하여 바흐 스타일의 기보 피아노 음악을 생성하는 모델링 방법을 비교 분석했습니다. Attention 기반 자기회귀적 LSTM, 잠재 변수 기반 VAE(벡터 양자화 포함), 그리고 GAN 세 가지 접근 방식을 비교한 결과, Attention-LSTM이 가장 높은 음악적 일관성을 보였습니다.
하이브리드 CNN-셀룰러 오토마타 화재 모델을 이용한 공중 산불 진압 계획
본 논문은 하이브리드 신경-셀룰러 오토마타(neural-cellular automaton)를 활용하여 공중 산불 진압 모델링 및 최적화 프레임워크를 제시합니다. 이 모델은 지형, 연료, 풍속 데이터 기반의 확산 거동 예측과 목표 공중 투하 설계를 결합했습니다. 또한 몬테카를로 샘플링을 통해 알레아토릭 및 인식론적 불확실성을 정량화하여 진압 계획의 견고성을 평가합니다.
그래프 신경망을 위한 절단된 위치 인코딩 이해하기
본 연구는 그래프 신경망(GNN)의 위치 인코딩(PEs)에 대한 이론적 분석을 제시합니다. 기존 PE 계열은 완전한 버전을 사용할 때만 이론적으로 동등하며, 실무에서 사용되는 '절단된' 변형의 표현력 속성은 알려지지 않았습니다. 본 연구는 절단 조건 하에서 여러 PE가 근본적으로 다름을 증명하고, $k$-하모닉 거리와 혼합 PE의 우수성을 입증했습니다.
VideoMDM: 2D 감독으로부터의 3D 인간 동작 생성을 향하여
VideoMDM은 단안 2D 포즈로부터 3D 인간 동작을 생성하는 확산 기반 프레임워크입니다. 이 모델은 별도의 3D 정답 데이터 없이 3D 동작 사전 지식을 학습하며, 2D 재투영 손실과 표준 3D 정규화 기법을 결합하여 높은 성능을 달성했습니다.
Hölder++: 멀티모달 VAE의 품질-일관성 트레이드오프 개선
본 논문은 기존 멀티모달 VAE가 겪는 생성 품질과 일관성 간의 트레이드오프 문제를 해결하기 위해 Hölder++를 제안합니다. Hölder++는 근사치 없는 Hölder 풀링 구현, 개별/공유 표현을 모델링하는 확장 아키텍처(Hölder+), 그리고 계층적 추론을 통해 이 문제를 개선했습니다.
분자 확산 모델을 위한 불확실성 추정
본 논문은 3D 분자 생성에 사용되는 확산 모델(Diffusion models)의 샘플별 불확실성을 추정하는 사후 방법을 제안합니다. 노이즈 제거 네트워크의 라플라스 근사를 기반으로, 생성 과정 전반의 노이즈 예측 가변성을 측정하여 샘플 품질 정보를 제공함을 입증했습니다.
공간 광자 이징 머신을 이용한 평형 전파의 광학적 구현
본 논문은 공간 광자 이징 머신(SPIM)을 활용하여 평형 전파(Equilibrium Propagation, EP)의 하이브리드 광-디지털 구현 방식을 제안합니다. SPIM은 위상 변조를 통해 연속적인 뉴런 상태와 이진 패턴 모두를 광학적으로 인코딩하며, 유한 차분 방식으로 추론을 실현했습니다. 이는 에너지 효율적인 물리적 AI 구현 경로를 제시합니다.
신경 모델 편집을 위한 강화학습
본 논문은 신경 모델 편집 과정을 강화학습(RL) 문제로 공식화한 탐색적 프레임워크를 제시합니다. 이 프레임워크는 에이전트가 보상 피드백을 통해 모델 가중치를 수정하며, 유틸리티 유지와 작업별 목표 달성을 결합합니다. 이를 통해 편향 완화 및 기계적 망각 같은 복잡한 편집 작업을 자동 학습할 수 있음을 입증했습니다.
지속성(Persistence)에서 생존 분석으로: 위상학적 특징에 대한 가설 검정, 효과 크기 및 벡터화
본 논문은 위상 데이터 분석(TDA)에서 사용되는 지속성 다이어그램을 생존 분석 관점에서 재해석한 STRAND를 제안합니다. 이 방법은 지속성 값을 시간-사건으로 간주하여, 단일 표현만으로 비모수적 가설 검정, 효과 크기 도출, 그리고 머신러닝용 안정적인 특징 벡터화를 가능하게 합니다.
NARRAS: 차량용 IoT 네트워크에서 CSI 기반 위치 추정을 위한 엣지 트리거 분산 추론
본 논문은 차량용 IoT 네트워크의 CSI 기반 위치 추정 문제를 다루며, 자원 제약 하에 효율적인 데이터 전송을 위한 '엣지 트리거 분산 추론(ETDI)' 프레임워크를 제안합니다. NARRAS라는 보고 정책은 각 안테나 배열이 로컬에서 관측치의 가치를 판단하여 필요한 정보만 융합 센터로 보내는 방식으로, 기존 방식의 비효율성을 개선했습니다.
범주형 사전 고착(Categorical Prior Lock-in): 구조화된 데이터에 대한 인컨텍스트 학습의 한계
LLMs는 구조화된 데이터 생성에 인컨텍스트 학습(ICL)을 많이 사용하지만, 고카디널리티 테이블형 데이터의 조건부 생성에는 한계가 있습니다. 본 연구는 ICL이 사전 학습 분포를 업데이트하지 못해 발생하는 '범주형 사전 고착'이라는 구조적 실패 모드를 식별했습니다. 이 현상은 희귀 클래스 재현에 어려움을 주며, LoRA 같은 파라미터 효율적 미세 조정도 근본적인 상충 관계를 가집니다.
PAWS: Advantage 가중 세그먼트를 활용한 선호도 학습
본 논문은 인간의 궤적 비교를 통해 정책을 학습하는 선호도 기반 강화학습(PbRL)의 한계를 다룹니다. 기존 방법들이 단계별 유틸리티 추정에 의존하여 발생하는 분포 이동 문제를 해결하기 위해, 세그먼트 수준의 어드밴티지 함수를 활용한 PAWS라는 새로운 방법을 제안합니다.
데이터셋에서 여러 해석 찾기
이 논문은 유사한 성능을 보이지만 컨텍스트 인식 특성이 매우 다른 모델들의 집합을 찾는 새로운 접근 방식을 제안합니다. METABRIC 데이터셋 실험 결과, 이 방법론은 기존 통제 방법보다 성능 저하 없이 다양한 유전자 발현 패턴을 가진 여러 모델들을 성공적으로 찾아냈습니다.
PianoKontext: 무표정한 맥락으로부터 표현적인 연주 렌더링
PianoKontext는 클래식 피아노 음악을 위한 표현적 연주 렌더링(EPR) 모델입니다. 기존 모델의 시간 제약을 극복하고, Music2Latent 모델의 잠재 공간에서 가변 길이의 연주를 생성합니다. DTW 기반 데이터 구성과 DiT 블록을 활용하여 악보와 실제 연주 간의 의존성을 학습했습니다.
Fourier Features를 이용해 에이전트가 높은 정밀도의 정책을 모방 학습으로 습득하게 하다
본 논문은 로봇 조작의 높은 정밀도를 위해 포인트 클라우드 기반 모방 학습에 Fourier features를 적용하는 방법을 제안합니다. 이 방법은 3D 정보를 직교 좌표 공간에서 고차원 Fourier 공간으로 매핑하여, 신경망이 놓치기 쉬운 높은 주파수 특징을 효과적으로 추출할 수 있게 합니다.
PDE 제약 역문제에서 Adjoint 방법과 Physics-Informed Neural Networks 비교
본 논문은 PDE 제약 역문제 해결을 위한 Adjoint 최적화와 Physics-Informed Neural Networks (PINNs)를 공정하게 비교합니다. 동일한 공식화, 도메인, 모델로 두 방법을 구현하고 다양한 벤치마크(Burgers, Darcy 등)에 적용했습니다. 그 결과, 미지 표현 방식이 성능을 크게 좌우하며, PINNs가 시간 의존적 문제에서 낮은 비용으로 높은 정확도를 제공함을 보여줍니다.
어텐션의 상전이: 복사 헤드 출현에 대한 베이지안 이론
본 논문은 트랜스포머의 핵심 메커니즘인 어텐션 패턴 학습에 대한 베이지안 이론을 제시했습니다. 특히, 복사 작업으로 훈련된 단일 레이어 소프트맥스 어텐션 네트워크를 분석하여 어텐션 행렬의 사후 확률 분포를 유도하고 저차원 공간으로 축소했습니다. 연구 결과, 대규모 언어 모델에서 관찰되는 복사 서브회로의 갑작스러운 출현에 대한 이론적 설명을 제공합니다.
결합 진동자 네트워크에서의 동기화를 통한 어텐션
본 논문은 에너지 제약이 있는 물리적 하드웨어 환경에서 트랜스포머의 Softmax 어텐션을 대체할 새로운 메커니즘을 제시합니다. 쿠라몬토 동기화 역학을 활용한 '고정 쿼리 진동자 어텐션'은 지수 함수 계산 없이 코사인 유사도를 통해 어텐션 가중치를 인코딩하며, 물리적 구현에 적합한 수학적 근거를 제공합니다.
이중 희소 명시적 조건부 변환 학습 (Learning Doubly Sparse Explicitly Conditioned Transforms)
데이터의 희소 구조를 효과적으로 포착하기 위해 고정된 정준 행렬과 데이터 적응형 희소 성분을 결합한 새로운 변환 학습 방식을 제안합니다. 이 방식은 기존 해석적 변환의 효율성을 유지하면서도 데이터에 대한 제어 가능한 적응성을 제공합니다.
이 피드 구독하기
본 페이지의 콘텐츠는 AI가 공개된 소스를 기반으로 자동 수집·요약·번역한 것입니다. 원 저작권은 각 원저작자에게 있으며, 각 게시물의 “원문 바로가기” 링크를 통해 원문을 확인할 수 있습니다. 저작권자의 삭제 요청이 있을 경우 신속히 조치합니다.