Insights
AI가 자동으로 큐레이션·번역·정리하는 기술 동향 피드입니다.
arXiv cs.LG 271건필터 해제
다중 모달 불확실성 하에서 견고한 민첩한 잡기 수행을 위한 변분 신경 신뢰 파라미터화
본 논문은 접촉 변동성 및 센싱 불확실성이 존재하는 환경에서 견고한 잡기(grasping) 수행을 위한 새로운 접근 방식을 제안합니다. 기존 방법들이 가진 확장성 문제와 높은 계산 비용 문제를 해결하기 위해, 잡기 획득 과정을 잠재 접촉 파라미터와 물체 자세에 대한 변분 추론으로 공식화하고 신뢰를 미분 가능한 가우시안 혼합으로 표현했습니다. 이를 통해 꼬리 견고성을 직접 최적화할 수 있는 경로상 경사(pathwise gradients) 기반의 CVaR 대체기를 구현하여, 기존 모델 예측 제어 방식 대비 더 높은 성능과 빠른 계산 속도를 달성했음을 시뮬레이션 및 실험을 통해 입증했습니다.
물리 정보 신경망의 잔차 손실 이상 분석: 비선형 동적 시스템에서 체제 전환을 갖는 변화점 탐지를 위한 역문제
본 논문은 체제 전환(regime transitions)을 포함하는 비선형 동적 시스템에서 변화점 탐지 및 파라미터 추정을 동시에 수행하기 위한 새로운 물리 정보 신경망(PINN) 기반 프레임워크를 제안합니다. 기존 방법들이 이 두 문제를 분리하여 다루는 한계를 극복하고, PINN의 잔차 손실 이상 분석을 활용하여 단일 통합 최적화 과정에서 변화점 위치와 조각별 파라미터를 동시에 추론할 수 있습니다. 실험 결과, 본 방법은 다양한 비선형 시스템 모델에 대해 기존 분리 접근법보다 높은 정확도와 효율성을 입증했습니다.
Schur 보조행렬을 통한 점수 야코비안의 최적화 자유형 위상 정렬을 위한 인과 발견
이 논문은 기존의 비볼록 최적화를 사용하는 연속적인 인과 발견(Continuous Causal Discovery)의 한계를 극복하기 위해 새로운 접근 방식을 제시합니다. 핵심 방법론인 Score-Schur Topological Sort (SSTS)는 구조 최적화 과정을 우회하고, 그래프 마진화가 점수-야코비안 정보 행렬(SJIM)의 Schur 보조행렬 계산과 수학적으로 동등함을 이용합니다. 이를 통해 무순환성 제약이 대수적 절차로 변환되어 O(d^3) 복잡도로 효율적인 인과 구조 분석을 가능하게 하며, 비선형 시스템에서도 확장성을 유지합니다.
트랜스포머를 통한 범용 추론의 장벽 (그리고 이를 극복하는 방법)
본 논문은 트랜스포머 모델의 추론 능력 향상에 사용되는 Chain-of-Thought (CoT) 기법의 한계를 이론적으로 분석합니다. 표준적인 위치 인코딩과 유한 알파벳 하에서는 CoT를 통한 표현력 증가가 $TC^0$ 이상의 문제를 해결할 수 없음을 증명했습니다. 그러나 어휘 확장을 허용하고 '마커 토큰' 및 '값 변화 인코딩' 같은 새로운 메커니즘을 도입함으로써, 트랜스포머는 반복 복사나 마지막 위치 검색과 같은 길이 일반화의 핵심 장애물을 극복하고 튜링 머신의 길이 일반화 가능한 시뮬레이션을 달성할 수 있음을 제시합니다.
Teacher Forcing as Generalized Bayes: Chaotic Dynamics 의 Switching Surrogates
본 논문은 혼돈적 동역학 시스템의 재구성(DSR)에서 사용되는 Teacher Forcing 기법을 분석하며, 이 방법이 일반화된 베이즈 업데이트와 어떻게 관련되는지 탐구합니다. 연구진은 Louis' identity를 활용하여 모호성 인식 관측 정보를 추정하고, 확률적 스위칭 증강 환경에서 Teacher Forcing과 주변 우도(marginal likelihood)의 목적함수 유도 곡률을 비교했습니다. 그 결과, Teacher Forcing이 단일 강제된 레짐 경로에 조건화될 경우 곡률이 부풀려지지만, 여러 스위칭 설명이 가능한 상황에서는 누락 정보 보정(missing-information correction)에 의해 주변 우도 곡률이 감소하는 현상을 발견했습니다.
단백질 역학: 구조, 에너지 및 동역학 학습 - 인공지능을 위한 단백질 역학에 대한 고찰
단백질 역학은 생물학적 기능의 핵심이지만, 높은 계산 비용과 데이터 부족으로 인해 연구가 어려웠습니다. 이 고찰서는 인공지능을 활용하여 단백질 역학 문제를 해결하는 최신 접근법들을 세 가지 관점(구조/궤적 학습, 에너지 신호 학습, 시뮬레이션 가속화)에서 심층적으로 검토합니다. 대표적인 방법론으로는 기계 학습 포텐셜, 볼츠만 생성기, 그리고 집단 변수 발견 등이 있으며, 데이터셋과 열역학적 일관성 확보가 주요 과제로 남아있습니다.
DGLight: 교통 신호 제어용 대형 언어 모델의 DQN 기반 GRPO 미세 조정
DGLight는 사전 학습된 대형 언어 모델(LLM)을 교통 신호 제어(TSC)에 효과적으로 적용하기 위한 새로운 강화학습 프레임워크입니다. 이 방법은 CoLight 기반 DQN 비평가를 훈련하여 교차로 상태의 행동 가치를 추정하고, 이를 활용해 Group Relative Policy Optimization (GRPO)를 통해 LLM 정책을 최적화합니다. DGLight는 해석 가능한 추론 과정을 거쳐 교통 신호를 결정하며, 실제 도시 데이터셋에서 강력한 성능과 우수한 전이 학습 능력을 입증했습니다.
스펙트럴 밴디트 (Spectral Bandits)
본 논문은 그래프 위에서 보상이 매끄러운 밴디트 문제를 다루며, 이는 콘텐츠 기반 추천과 같은 온라인 학습 문제에 적용 가능합니다. 이 프레임워크는 각 항목을 무방향 그래프의 노드로 간주하고, 기대 평점이 이웃 노드와 유사하다는 특성을 활용하여 높은 평가를 가진 항목을 추천하는 것을 목표로 합니다. 연구진은 작은 유효 차원 개념을 도입하고, 이를 기반으로 누적 후회가 노드 수에 따라 나쁘게 확장되지 않는 세 가지 알고리즘을 제안했습니다.
확률적 결정 집합과 적대적 손실을 가진 온라인 조합 최적화
본 논문은 행동이 고장 나거나 차단될 수 있는 등 신뢰할 수 없는 복합 행동 환경에서 온라인 조합 최적화 문제를 다룹니다. 연구진은 확률적 가용성을 처리하는 새로운 학습 알고리즘을 제안하며, 이는 Follow-The-Perturbed-Leader 예측 방법을 기반으로 합니다. 이 알고리즘은 'Counting Asleep Times'라는 독창적인 손실 추정 기법에 의존하며, 전체 정보, (반-)밴디트, 제한 정보 설정 모두에 대한 후회 경계를 제공하고 기존 방법 대비 성능을 크게 개선했음을 입증했습니다.
Erdős-Rényi 측관측 그래프를 이용한 온라인 학습
본 논문은 학습자가 선택한 팔 외에도 일정 확률로 다른 팔들의 손실을 관측할 수 있는 적대적 다팔 밴디트 문제를 다룹니다. 연구진은 서로 다른 손실 공개 확률 $r$의 범위에 적용되는 두 가지 새로운 알고리즘을 제안했습니다. 이 알고리즘들은 각각 특정 조건 하에서 기대 후회(expected regret)를 최적으로 달성하며, 특히 빠른 추정 절차도 함께 제공합니다.
분리된 잡음 데이터 다양체에서 확산 생성 모델의 시간 조건화 탐색
본 연구는 확산 모델에서 시간 조건화의 필요성을 기하학적으로 재검토합니다. 전방 확산 과정 하에서 잡음 데이터 분포가 저차원 다양체 위에 집중하며, 성공적인 생성은 이 다양체의 분리(disentanglement)에 달려있음을 밝힙니다. 이를 바탕으로 DDIM의 전방 과정을 수정하여 시간 조건화 없이도 flow-matching 접근법과 정렬함으로써 고품질 콘텐츠 생성을 달성할 수 있음을 증명하고, 클래스-조건부 생성 프레임워크를 확장했습니다.
RCProb: 트리 앙상블의 효율적 단순화를 위한 확률론적 규칙 추출
본 논문은 복잡한 트리 앙상블 모델의 해석 가능성 문제를 해결하기 위해, 결정 규칙(decision rules)을 추출하는 새로운 확률론적 방법을 제안합니다. 기존 방법인 RuleCOSI+는 정확하지만 대규모 데이터셋에서 계산 비용이 높다는 단점이 있었습니다. 따라서 RCProb은 Dirichlet 및 Beta 평활화를 사용하여 반복적인 데이터 스캔 없이 효율적으로 규칙 통계를 추정함으로써, 컴팩트한 규칙 세트를 유지하면서도 런타임 속도를 크게 개선했습니다.
QFlash: 비전 트랜스포머 주의력에서 양자화와 메모리 효율성 연결
QFlash는 비전 트랜스포머(ViT 등)의 주의 메커니즘에 대한 완전한 정수 기반 FlashAttention을 제안합니다. 기존 FlashAttention이 부동소수점 연산을 사용해야 하는 한계를 극복하고, 단일 Triton 커널로 구현되어 메모리 효율성과 속도를 크게 향상시킵니다. 실험 결과, QFlash는 다양한 ViT 아키텍처에서 최대 8배 이상의 속도 향상을 달성했으며, 에너지 소비를 줄이면서도 모델의 정확도를 유지하는 것이 입증되었습니다.
GraphPL: 패치워크 러닝을 위한 효율적이고 견고한 모달리티 임프루트먼트를 위한 GNN 활용
본 논문은 분산 환경에서 클라이언트별로 이용 가능한 모달리티가 상이한 문제를 해결하기 위해 GraphPL이라는 새로운 프레임워크를 제안합니다. GraphPL은 그래프 신경망(GNN)과 패치워크 러닝을 결합하여, 각 클라이언트의 누락된 모달리티 정보를 비지도 방식으로 효율적이고 견고하게 임프루트먼트하는 것을 목표로 합니다. 실험 결과는 GraphPL이 다양한 벤치마크 및 실제 전자 건강 기록 데이터셋에서 최고 성능(SOTA)을 달성하며 강력한 다운스트림 특징 학습 능력을 입증했습니다.
엔트로피 정규화된 복제자 방정식에 따른 별아교 게이트 연상 기억 동역학에서 나타나는 자기 주의
본 논문은 엔트로피 정규화된 복제자 방정식에 따라 진화하며 별아교 이득으로 곱셈적으로 조절되는 홉필드형 연상 기억 모델을 제안합니다. 이 뉴런-별아교 동역학 시스템은 리야푸노프 함수를 통해 전역 수렴이 보장되며, 고정점에서 소프트맥스 정규화를 사용하여 자기 주의(self-attention) 메커니즘을 기계적으로 구현합니다. 이 모델은 높은 기억 부하와 간섭 환경에서 기존의 홉필드 동역학 및 뉴런-별아교 기준선보다 검색 정확도가 우수함을 보여주며, 신경교 조절과 주의 계산을 통합하는 새로운 프레임워크를 제시합니다.
주저에서 경쟁력까지: 입력-상태 안정성을 통한 ZO-FO 격차 폐쇄
본 연구는 최적화 알고리즘을 동적 시스템 관점에서 분석하여, 제로 차(ZO) 알고리즘이 일 차(FO) 대응 알고리즘과 달리 반복 횟수에 대한 추가적인 의존성을 갖지 않음을 이론적으로 증명합니다. 특히 입력-상태 안정성(ISS) 특성을 활용함으로써, ZO 방법이 FO 방법과 동일한 감쇠율을 가지며 고정점 근처로 수렴함을 보였습니다. 이러한 결과는 최적화 알고리즘의 안정성과 효율성을 향상시키는 새로운 이론적 기반을 제공합니다.
구조 동적 모델의 베이지안 업데이트를 위한 적응형 메타러닝 확률적 경량 해밀턴 몬테카를로 시뮬레이션
본 논문은 구조 건강 모니터링 분야에서 사용되는 구조 동적 모델의 베이지안 업데이트 문제를 해결하기 위한 새로운 알고리즘인 적응형 메타러닝 확률적 경량 해밀턴 몬테카를로(AM-SGHMC)을 제안합니다. 기존 MCMC 기반 접근법은 새로운 작업에 직면할 때마다 신경망 재학습이 필요하여 비효율적이었습니다. AM-SGHMC는 적응형 메타러닝 기법을 사용하여 샘플링 전략을 최적화하며, 추가 학습 없이 다양한 구조 유형의 베이지안 업데이트 문제에 일반화되어 적용될 수 있음을 입증했습니다.
Safe-Support Q-Learning: 위험한 탐색 없이 학습하기
본 연구는 위험한 탐색으로 인한 문제를 해결하기 위해 강화학습(RL)의 안전성을 높인 프레임워크를 제안합니다. 기존 방법들이 단순히 패널티로 위험을 완화하는 것과 달리, 이 접근법은 훈련 과정에서 아예 위험한 상태 방문 자체를 제거하는 엄격한 안전 요구사항을 채택했습니다. 이를 위해 '안전한 집합(safe set)' 기반의 행동 정책을 활용하고, Q 함수와 정책을 분리하여 KL 정규화 벨만 목표를 통해 안정적으로 학습시키는 2단계 프레임워크를 구축했습니다.
편향된 꿈: 잠재 공간 모델에서의 인식적 불확실성 정량화의 한계
본 논문은 모델 기반 강화학습(MBRL)에서 잠재 역학 모델을 사용하여 인식적 불확실성(epistemic uncertainty)을 정량화하는 데 존재하는 근본적인 한계를 지적한다. 연구진은 실제 환경의 동역학이 잠재 공간 내 특정 영역으로 편향되는 '끌개 행동(attractor behavior)'을 보이며, 이로 인해 환경 역학의 불일치가 제대로 포착되지 않아 인식적 불확실성 추정의 신뢰성이 떨어진다는 것을 발견했다. 결과적으로, 모델은 실제보다 높은 예측 보상을 체계적으로 과대평가하는 경향이 있다.
EvoTSC: 유전 프로그래밍을 통한 시계열 분류를 위한 특징 학습 모델 진화
EvoTSC는 시계열 분류를 위한 경량 특징 학습 모델을 자동으로 진화시키기 위해 설계된 새로운 유전 프로그래밍(Genetic Programming) 접근법입니다. 이 방법은 사전 전문가 지식을 전략적으로 통합한 다층 프로그램 구조를 사용하여 검색 효율성을 높이고, 파레토 토너먼트 선택 전략을 통해 과적합 문제를 완화합니다. 단변량 시계열 데이터셋에서 광범위하게 테스트된 결과, EvoTSC는 기존의 벤치마크 방법들보다 뛰어난 성능을 입증했습니다.
이 피드 구독하기
본 페이지의 콘텐츠는 AI가 공개된 소스를 기반으로 자동 수집·요약·번역한 것입니다. 원 저작권은 각 원저작자에게 있으며, 각 게시물의 “원문 바로가기” 링크를 통해 원문을 확인할 수 있습니다. 저작권자의 삭제 요청이 있을 경우 신속히 조치합니다.