© 2026 Molayo

Insights

AI가 자동으로 큐레이션·번역·정리하는 기술 동향 피드입니다.

arXiv cs.LG 2125건필터 해제

Attention 및 Understanding LoRA의 수렴적 확률적 훈련

본 논문은 트랜스포머 모델에서 핵심적인 구성 요소인 어텐션 레이어와 얕은 신경망에 LoRA(Low Rank Adaptation)를 적용한 경우의 확률적 훈련 가능성을 엄격하게 증명합니다. 연구진은 임의의 완만한 정규화 하에서, 두 구조 모두 해당 Gibbs 측정에 포앙카레 부등식을 유도함을 보였습니다. 이를 통해 SGD를 모방하는 특정 SDE가 손실을 최소화하며, 이는 데이터나 아키텍처 크기에 대한 가정을 요구하지 않는 최초의 결과입니다.

FLAM: 연합 학습에서 집계 가능한 측정 지표를 사용한 모델 성능 평가

연합 학습(FL) 환경에서 분산된 데이터를 사용하기 때문에 모델 성능 평가는 어려운 과제입니다. 기존의 접근 방식은 로컬 샘플 수에 기반한 가중 평균 등 집계 전략에 의존하며, 이는 중앙 집중식 평가와 불일치를 보일 수 있습니다. 본 논문에서는 이러한 문제를 해결하기 위해, 전역 테스트 데이터셋 없이도 중앙 집중식 평가와 동일한 결과를 산출하는 '집계 가능한 측정 지표(Aggregatable Metrics)' 기반의 성능 평가 방법인 FLAM을 제안합니다.

DVD: 3D 생성을 위한 이산 복셀 확산 (Discrete Voxel Diffusion for 3D Generation and Editing)

본 논문은 3D 생성 및 편집 파이프라인에 사용되는 이산 확산 프레임워크인 Discrete Voxel Diffusion (DVD)를 소개합니다. DVD는 복셀 점유율을 네이티브 이산 변수로 처리하여, 연속-이산 임계값 처리를 우회하고 효율적인 3D 스캐폴드 생성 및 편집 기능을 제공합니다. 또한, 예측 엔트로피를 활용한 불확실성 측정과 경량 미세 조정 전략을 통해 모델의 해석 가능성과 실용성을 높였습니다.

증거 기반 사전 분포 하에서의 인과 추론 추정량의 베이즈 민감도

본 논문은 인과 추론에서 사용되는 민감도 분석의 한계를 지적하며, 기존의 최악의 경우(worst-case) 접근 방식이 비현실적이거나 정보성이 떨어지는 결론을 초래할 수 있음을 주장합니다. 이를 개선하기 위해, 연구진은 '베이즈 민감도 값(Bayesian Sensitivity Value, BSV)'이라는 새로운 기준을 제안했습니다. BSV는 실제 세계의 증거 기반 사전 분포 하에서 가정 위반에 대한 추정량의 기대 민감도를 계산하여, 보다 현실적이고 견고한 인과 추론 분석을 가능하게 합니다.

민감도 및 패턴화: 베이즈 학습에서의 선형 응답 입문

이 기술 노트는 신경망 해석을 위한 '민감도(susceptibilities)' 이론을 소개하며, 이는 관측 가능한 $\varphi$가 데이터 교란에 대해 가지는 민감도를 사후 기대값의 미분으로 정의합니다. 이 민감도는 요동-소산 정리(fluctuation--dissipation theorem)를 통해 사후 공분산과 같다는 점이 핵심입니다. 또한, 다양한 관측 가능량($\varphi$)을 선택함으로써 샘플별 손실이나 구조적 민감도 행렬 등 여러 유용한 객체를 도출할 수 있으며, 이는 모델의 패턴화 문제 해결에 활용될 수 있습니다.

STEPS: 시계열 예측을 위한 다양체 상의 시간적 오차 전파 솔버

STEPS는 제한된 관측치와 노이즈가 있는 소스 프리 온라인 환경에서 시계열 예측 성능을 향상시키기 위한 새로운 접근 방식입니다. 이 방법은 기존의 Test-Time Adaptation(TTA)가 직면하는 희소한 접두사, 오차 누적, 불안정한 장기 예측 수정 등의 문제를 해결합니다. STEPS는 시계열 예측 TTA를 시간 다양체 상의 디리클레 경계값 문제로 재정식화하여 안정적이고 효과적인 오차 전파 솔버를 제공합니다.

위치: 메커니즘 해석 가능성은 인과적 주장을 위해 식별 가정을 공개해야 한다

최근 메커니즘 해석 가능성 연구들은 회로, 매개자 등 인과적 용어를 사용하며 발전하고 있지만, 이들의 주장은 명시적인 식별 가정(identification assumptions)을 요구합니다. 본 논문은 여러 관련 논문을 감사한 결과, 대부분의 연구가 이러한 가정을 명확히 밝히지 않고 검증 지표를 통해 인과적 지원으로 제시하는 패턴을 발견했습니다. 따라서 저자들은 주장된 인과성을 뒷받침하기 위해 식별 전략과 그 가정들을 투명하게 공개해야 하는 새로운 규범(disclosure norm)을 제안합니다.

취약성(Susceptibilities)을 이용한 강화학습 에이전트 해석

본 기사는 신경망 해석 가능성 기법인 '취약성(Susceptibilities)'을 심층 강화학습(DRL) 분야의 후회(regret) 설정으로 확장하여 그 유용성을 탐구한다. 취약성은 관찰 가능한 값의 사후 기대값이 손실에 대한 섭동에 어떻게 반응하는지를 측정하며, 이를 통해 학습된 정책이 발전하는 과정에서 발생하는 내부적인 모델 특징들을 밝혀낼 수 있다. 연구진은 활성화 스티어링(activation-steering)을 사용하여 이 결과를 검증하고, RLHF 후 훈련에 적용할 프레임워크 확장을 논의한다.

STARFlow2: 언어 모델과 정규화 흐름을 연결하여 통합 멀티모달 생성을 위한 방법

STARFlow2는 언어 모델과 정규화 흐름(Normalizing Flows)의 공통적인 자기회귀적 특성을 활용하여 통합 멀티모달 생성을 목표로 합니다. 기존 방식이 텍스트 생성과 이미지 디노이징 과정에서 구조적 불일치를 겪었던 문제를 해결하기 위해, STARFlow2는 자기회귀 정규화 흐름을 도입합니다. 이 접근법은 LLM과 동일한 인과 마스크 및 순차적 구조를 공유함으로써, 텍스트와 이미지를 매끄럽게 연결하는 진정한 통합 멀티모달 시스템을 구축할 수 있게 합니다.

PET-Adapter: 전체 및 제한 각도 PET 이미지 재구성을 위한 테스트 시간 도메인 적응

PET-Adapter는 양전자 방출 단층촬영(PET) 이미지 재구성 과정에서 발생하는 푸아송 노이즈와 제한 각도 획득 문제를 해결하기 위해 제안된 테스트 시간 도메인 적응 프레임워크입니다. 이 방법은 팬텀 데이터로 사전 학습된 생성형 PET 모델을 다양한 해부학 구조 및 추적자를 가진 임상 데이터셋에 효과적으로 적응시킬 수 있게 합니다.

Pair를 넘어서: 언어 모델은 비밀리에 선호도 그래프를 최적화합니다

본 기사는 기존의 직접 선호도 최적화(DPO)가 쌍별 비교에 의존하는 한계를 지적하며, 실제 환경에서 발생하는 풍부한 롤아웃 순위 데이터를 활용하기 위한 새로운 방법론을 제안합니다. 이 방법은 '그래프 직접 선호도 최적화(Graph Direct Preference Optimization, GraphDPO)'를 도입하여, 데이터 내의 복잡한 지배 관계를 방향성 비순환 그래프로 모델링하고 이를 통해 언어 모델 정렬의 정확성과 견고성을 높입니다.

Kronecker에 얽매이지 마세요: 고차원 불완전 격자에서의 가우시안 프로세스

본 기술 기사는 고차원 환경에서 수치적으로 정확한 가우시안 프로세스 회귀(GPR)를 수행하는 새로운 방법인 CUTS-GPR을 소개합니다. CUTS-GPR은 훈련 데이터 양($N$)에 대해서는 준선형 또는 선형 스케일링, 차원($D$)에 대해서는 저차 다항식 스케일링을 보이는 매우 빠른 커널 행렬-벡터 곱셈을 핵심으로 합니다. 이 방법은 가산성 커널과 불완전 격자 구조적 특성을 결합하여 고차원 포텐셜 에너지 표면의 베이지안 모델링을 가능하게 하며, 계산 화학 분야의 난제를 해결할 잠재력을 보여줍니다.

지수 효용을 위한 강화학습: 할인된 MDP에서의 알고리즘 및 수렴성

본 논문은 할인된 마르코프 결정 과정(MDP)에서 지수 효용을 최대화하는 강화학습(RL)의 이론적 문제를 다룹니다. 기존 가치 기반 알고리즘의 부족함을 해결하기 위해, 연구진은 고정 위험 회피 설정 하에 두 가지 Q-값 스타일 확장을 제시합니다. 이 확장들은 각각 $L_ ext{inf}$ 및 sup-log/Thompson 메트릭에서 수축 연산자임을 증명하며, 이를 통해 유도된 탐욕적 정상 정책이 지수 효용 목표를 달성하는 최적의 정상 정책임을 수학적으로 입증합니다.

Normalizing Trajectory Models

Normalizing Trajectory Models (NTM)는 확산 기반 모델의 샘플링 과정에서 발생하는 우도(likelihood) 손실 문제를 해결하기 위해 제안된 새로운 프레임워크입니다. 기존 방법들이 증류나 일관성 훈련을 통해 소수 단계로 압축하는 과정에서 정확한 우도 학습 능력을 포기했던 것과 달리, NTM은 각 역방향 단계를 표현력 있는 조건부 정규화 흐름(conditional normalizing flow)으로 모델링합니다. 이를 통해 확산 모델의 생성 과정을 유지하면서도 이론적으로 정확하고 높은 우도를 갖는 샘플링이 가능하게 합니다.

Weight-Decay Turns Transformer Loss Landscapes Villani: Functional-Analytic

본 논문은 대규모 언어 모델(LLM)에서 사용되는 가중치 감쇠(weight decay)가 트랜스포머 손실 지형에 미치는 영향을 기능-해석적 관점에서 엄밀하게 분석합니다. 연구진은 표준 교차 엔트로피 손실과 $L^2$ 정규화가 Villani의 강제 에너지 함수 조건을 만족함을 증명하고, 이를 통해 로그-소보레프 및 포인카레 상수와 같은 중요한 일반화 한계를 유도했습니다. 또한, 대규모 모델에 적용 가능한 새로운 진단 도구 $\Psi_s(\theta)$를 제시하고 실제 실험을 통해 가중치 감쇠가 최적화 과정의 수렴성과 일반화 성능 향상에 필수적인 수학적 기반을 제공함을 입증했습니다.

Optimizing Social Utility in Sequential Experiments

본 논문은 고위험 제품(예: 의약품) 개발 과정에서 발생하는 대규모 무작위 대조 시험의 높은 비용 문제를 다룹니다. 이 비효율성을 해결하기 위해, 개발자가 순차적으로 임상시험을 수행하고 규제 기관이 비용을 부분 보조하는 실험에 대한 통계적 프로토콜을 제안합니다. Belief Markov Decision Process를 활용하여 사회 효용을 분석한 결과, 최적의 보조 수준을 효율적으로 찾을 수 있음을 입증했으며, 시뮬레이션 결과 표준 방식 대비 높은 사회적 효용 증가 효과를 보여주었습니다.

DARTS: 예산 제약 순차 실험에서 예측 변수(Prognostic Covariates) 타겟팅

DARTS(Dynamic Adaptive Rerandomization via Thompson Sampling)는 예후 공변량(prognostic covariates) 획득 비용이 제한적인 상황에서 순차적 최적화 문제를 통해 인과 추론을 수행하는 방법론입니다. 이 기법은 공변량 획득을 연속적인 과정으로 보고, 통섬 샘플링(Thompson Sampling)을 활용하여 각 배치마다 가장 예후적으로 유용한 공변량을 식별합니다. 이를 통해 측정 예산 제약 하에서도 높은 정밀도를 유지하며 무작위 배정의 타당성을 보존하는 것이 핵심입니다.

TCGA-BRCA 유전자 발현 데이터로 인한 유방암 하위 유형 분류에서 모델 복잡성이 특징 차원보다 우세함

본 연구는 TCGA-BRCA 유전자 발현 데이터를 활용하여 유방암 하위 유형을 분류하는 기계 학습 모델의 성능을 분석했습니다. 고차원적이고 샘플 수가 제한적인 생물학적 데이터셋의 특성상, 단순히 높은 정확도만으로는 충분하지 않으며, 매크로 F1 점수와 같은 균형 잡힌 평가 지표가 중요함을 보여주었습니다. 특히 로지스틱 회귀 모델이 하위 유형 전반에 걸쳐 가장 안정적이고 우수한 성능을 보였으며, 이는 고차원 생물학적 분류 작업에서 모델의 단순성과 적절한 평가 지표 선택이 핵심임을 시사합니다.

Online Bayesian Calibration under Gradual and Abrupt System Changes

본 논문은 시스템이 점진적인 드리프트와 갑작스러운 변화를 겪는 환경에서 작동하는 온라인 베이지안 보정 프레임워크인 Bayesian Recursive Projected Calibration (BRPC)을 제안합니다. 기존의 고전적 방법들은 파라미터-불일치 혼란이나 정적 데이터 가정 등의 한계를 가집니다. BRPC는 불일치 없는 입자 업데이트와 조건부 가우시안 프로세스 업데이트를 결합하여 식별성을 유지하면서도 시스템 편향에 적응할 수 있게 하며, 급격한 변화 감지 및 재설정 메커니즘을 통합하여 견고성을 높였습니다.

PianoCoRe: Combined and Refined Piano MIDI Dataset

PianoCoRe는 기존의 한계점을 극복한 대규모 통합 및 정제된 피아노 MIDI 데이터셋입니다. 이 데이터셋은 483명의 작곡가가 작성한 5,625곡의 250,046개 연주를 포함하며 총 21,763시간 분량의 방대한 양질의 음악 데이터를 제공합니다. 또한, Note-level 정렬(alignment)을 갖춘 서브셋(PianoCoRe-A)과 데이터 품질 향상을 위한 MIDI 분류기 및 정제 파이프라인도 함께 제공되어, 차세대 표현적 피아노 연주 연구의 기반을 마련했습니다.

이 피드 구독하기

RSSFeedly, Inoreader 등으로 구독

API/api/search?q=검색어

AIllms.txt로 AI 크롤링 가이드

본 페이지의 콘텐츠는 AI가 공개된 소스를 기반으로 자동 수집·요약·번역한 것입니다. 원 저작권은 각 원저작자에게 있으며, 각 게시물의 “원문 바로가기” 링크를 통해 원문을 확인할 수 있습니다. 저작권자의 삭제 요청이 있을 경우 신속히 조치합니다.