Insights

AI가 자동으로 큐레이션·번역·정리하는 기술 동향 피드입니다.

arXiv cs.LG 2000건필터 해제

Archetype 제거: Archetypal SAE의 안정성은 초기화 및 지표 설계의 산물이다

Archetypal SAE가 주장하는 안정성이 실제로는 초기화 방식의 결과임을 입증하는 연구입니다. 안정성과 안정화의 개념을 명확히 구분하고, 초기화 제거 실험을 통해 Archetypal 제약 조건의 실질적 효과를 분석했습니다.

6월 2일0

arXiv논문

$\ell_2$-norm 및 $\ell_\infty$-norm을 넘어: 심층 신경망을 위한 곡률 기반 $\ell_p$-norm 스킴

기존 $\ell_2$ 및 $\ell_\infty$ norm 기반 최적화 도구의 한계를 극복하기 위해 곡률 기반의 동적 $\ell_p$-norm 스킴을 제안합니다. 학습 단계에 따라 $p$ 값을 조절하여 높은 곡률 방향의 지배력을 억제하고 안정적인 수렴을 유도합니다.

6월 2일0

arXiv논문

실제적인 노이즈 합성(Realistic noise synthesis)을 통한 편향 감소 및 지도 학습 기반 조직 미세구조 추정 성능 향상

Diffusion MRI의 미세구조 추정 시 발생하는 노이즈 특성 차이와 공변량 변화 문제를 해결하기 위한 RNS 프레임워크를 제안합니다. Rician 기대값과 효과적인 후처리 노이즈 분산을 통합하여 낮은 SNR 환경에서도 편향 없는 정밀한 파라미터 추정이 가능함을 입증했습니다.

6월 2일0

arXiv논문

Convex Distance Operator Transport: 볼록성 및 기하학적 구조를 보존하는 정식화

이질적인 도메인 간 분포 정렬을 위해 기하학적 구조와 특징 대응성을 보존하는 새로운 볼록 최적 운송 프레임워크인 CDOT를 제안합니다. 거리 연산자를 활용한 정규화를 통해 국소적 변동에 대한 강건성을 확보하고, 기존 GW 방식의 비볼록성을 수학적으로 규명했습니다.

6월 2일0

arXiv논문

평면 대칭 패턴 생성

기존 2D 연속 표현이 평면 군 대칭을 강제할 때 발생하는 연속성 문제를 해결하기 위한 새로운 대칭화 프레임워크를 제안합니다. 수학적 공식을 통해 임의의 평면 군을 유지하면서도 연속성을 보존하는 변환 방법을 제시합니다.

6월 2일0

arXiv논문

확률적 반복 알고리즘의 비점근적 수렴: Lyapunov 프레임워크

노이즈가 포함된 오라클을 사용하는 확률적 근사(SA) 알고리즘의 유한 시간 분석을 위한 Lyapunov 프레임워크를 조사합니다. 일반화된 모로 포락선을 활용하여 수렴성을 보장하며, SGD 및 강화학습 알고리즘으로의 확장 가능성을 제시합니다.

6월 1일0

arXiv논문

S$^3$LDBO: 분산형 이중 수준 최적화 (Decentralized Bilevel Optimization)를 위한 스냅샷 단일 루프 알고리즘

네트워크화된 AI 시스템의 이중 수준 최적화 문제를 해결하기 위해 스냅샷 메커니즘을 활용한 S³LDBO 알고리즘을 제안합니다. 이 알고리즘은 비용이 많이 드는 미분 평가를 간헐적으로 건너뛰어 계산 효율성을 높이면서도 글로벌 협력 학습을 유지합니다.

6월 1일0

arXiv논문

그래프 신경망 (GNN)은 그래프 해상도에 대해 연속적이지 않다

GNN이 그래프 해상도 변화에 대해 연속적이지 않아 유사한 그래프에도 서로 다른 잠재 표현을 생성한다는 문제를 지적합니다. 정보 전파 방식의 구조적 장애물을 원인으로 분석하고, 이를 해결하기 위한 아키텍처 수정 방안을 제안합니다.

6월 1일0

arXiv논문

망각에는 이웃이 있다: 머신 언러닝(Machine Unlearning)에서의 국소적 부수적 망각

머신 언러닝 과정에서 특정 데이터 삭제 시 인접한 데이터까지 함께 망각되는 '국소적 부수적 망각' 현상을 분석합니다. 이를 해결하기 위해 망각 세트의 이웃 데이터를 활용한 '국소 교사 증류' 전략을 제안하여 언러닝 품질을 개선합니다.

6월 1일0

arXiv논문

심플렉스(Simplex) 상의 로그 비율 전파: 구성 데이터(Compositional Data)의 셀 단위 오염(Cellwise

구성 데이터(Compositional Data) 분석 시 로그 비율 변환 과정에서 발생하는 셀 단위 오염 전파 메커니즘을 이론적으로 규명합니다. 기존 유클리드 방식의 부적절함을 지적하고, 심플렉스 상에서의 새로운 강건한(robust) 통계적 방법론을 위한 이론적 토대를 제시합니다.

6월 1일0

arXiv논문

다중 에이전트 강화학습 (Multi-Agent Reinforcement Learning)에서의 일반화된 의도 모델링 (Generalized

다중 에이전트 강화학습(MARL)에서 작업과 환경에 따라 변하는 상대방의 의도를 효과적으로 모델링하기 위한 새로운 프레임워크를 제안합니다. 성능 중심의 다중 의도 표현 혼합과 미래 수익과의 상호 정보량을 최대화하는 방식을 통해 기존 모델링의 한계를 극복합니다.

6월 1일0

arXiv논문

조절 가능한 오라클 충실도(Oracle Fidelity)를 갖는 0차 최적화(Zeroth-Order Optimization)의

그래디언트 사용이 불가능하거나 비용이 높은 시뮬레이션 환경을 위한 0차 최적화 연구입니다. 쿼리의 정확도와 계산 비용 간의 트레이드오프를 고려하여 전체 실행 시간을 최소화하는 정확도 인식형 Wall-clock 모델을 제안합니다.

6월 1일0

arXiv논문

구조화된 일반화 선형 토큰 믹싱을 통한 표현력을 위한 복잡도 트레이드오프

본 논문은 토큰 믹싱 레이어의 효율성과 표현력 사이의 트레이드오프를 분석하는 통합 프레임워크를 제안합니다. 어텐션과 상태 공간 모델을 아우르는 일반화된 재귀 방정식을 통해, 실행 시간과 모델 표현력을 원칙적으로 교환할 수 있는 새로운 설계 방식을 제시합니다.

6월 1일0

arXiv논문

변분 생성 Wasserstein 흐름(Variational Generative Wasserstein Flows)에 대한 통합적 관점

Wasserstein 경사 흐름을 기반으로 생성 모델링을 위한 통합적 이론 프레임워크인 GWF를 제안합니다. 기존 방법론들을 JKO 스킴의 사례로 통합하고, f-발산을 넘어 다양한 확률 메트릭으로 확장하여 새로운 알고리즘과 GANs 간의 관계를 규명합니다.

6월 1일0

arXiv논문

Softsign: 더 나은 파라미터 이질성 (Parameter Heterogeneity) 처리를 위한 옵티마이저용 부드러운 부호 (Smooth

부호 기반 옵티마이저의 고정된 업데이트 크기 문제를 해결하기 위해 SoftSignum을 제안합니다. 온도 제어형 소프트 사인 변환을 통해 파라미터 이질성을 처리하며, LLM 사전 학습 등 다양한 작업에서 AdamW보다 우수한 성능을 입증했습니다.

6월 1일0

arXiv논문

Max-Min 기준을 이용한 제약 조건이 있는 다중 목적 강화학습 (Constrained Multi-Objective Reinforcement

본 논문은 제약 조건이 포함된 다중 목적 강화학습(MORL)을 위한 새로운 Max-min 프레임워크를 제안합니다. 공정성을 증진하면서도 명시적인 제약 조건을 만족시키는 이론적 토대를 구축하고 다양한 시뮬레이션 환경에서 성능을 검증했습니다.

6월 1일0

arXiv논문

Hyper-Kamiokande 실험을 위한 딥러닝 기반 저에너지 트리거 알고리즘

Hyper-Kamiokande 검출기의 저에너지 중성미자 이벤트를 포착하기 위한 딥러닝 기반 트리거 알고리즘 연구입니다. 지도 학습 모델과 MPDR 기반 이상 탐지 모델을 통해 기존 방식보다 높은 신호 식별 효율을 입증했습니다.

6월 1일0

arXiv논문

평균 매끄러움 (Average Smoothness)을 이용한 Langevin Monte Carlo의 개선된 보장 (Guarantees)

Wasserstein 거리를 기준으로 Langevin Monte Carlo(LMC)의 비점근적 경계를 개선한 연구입니다. 전역 매끄러움 대신 평균 좌표별 매끄러움 상수를 사용하여 이산화 오차를 더 정확하게 측정하며, SGLD 및 유한 합 문제로 확장 적용 가능함을 입증했습니다.

6월 1일0

arXiv논문

비선형 벡터 자기회귀 모델에서의 흐름 맵 학습: 특징 라이브러리 구조가 훈련 오차에 미치는 영향

비선형 벡터 자기회귀(NVAR) 모델에서 특징 라이브러리 구조가 훈련 오차와 예측 성능에 미치는 영향을 분석한 연구입니다. 시간 해상도와 라이브러리의 표현 능력에 따른 스케일링 법칙을 규명하고, 모델의 일반화 성능을 결정하는 요인을 제시합니다.

6월 1일0

arXiv논문

DG-CoLearn: 동적 그래프를 위한 효율적인 협업 학습 프레임워크

DG-CoLearn은 동적 그래프 학습 시 발생하는 계산 오버헤드와 개인정보 보호 문제를 해결하기 위한 협업 학습 프레임워크입니다. 증분적 스냅샷 처리와 서버 매개 임베딩 교환 방식을 통해 데이터 보안을 유지하며 학습 효율을 극대화합니다.

6월 1일0

이 피드 구독하기

RSSFeedly, Inoreader 등으로 구독

API/api/search?q=검색어

AIllms.txt로 AI 크롤링 가이드