Insights
AI가 자동으로 큐레이션·번역·정리하는 기술 동향 피드입니다.
arXiv cs.LG 1862건필터 해제
뉴로심볼릭 자율 사이버 에이전트를 위한 관찰 기반 레드 에이전트 정책 학습
부분 관측 가능 환경에서 뉴로심볼릭 자율 사이버 방어 에이전트를 보호하기 위한 레드 에이전트 정책 학습 기술을 제안합니다. 모방 학습을 통해 공격자의 행동을 예측하고 방어 에이전트가 효과적으로 대응할 수 있도록 돕습니다.
해상도에 불변하는 적응형 볼륨 기계적 특성 필드
3D 객체의 물리적 특성(영률, 포아송 비, 밀도)을 해상도에 관계없이 정확하게 예측하는 AdaVoMP 방법론을 제안합니다. 희소 적응형 복셀 구조(SAV)와 트랜스포머 모델을 활용하여 기존 기술 대비 높은 해상도와 메모리 효율성을 달성했습니다.
Sign-Rank, Index, 그리고 List Replicability: 연결성과 분리성
이진 개념 클래스의 sign rank 하한을 구하기 위해 $\mathbb{Z}_2$-index와 list replicability number를 활용한 연구를 다룹니다. 두 척도 간의 관계를 규명하고, sign rank와 $\mathbb{Z}_2$-index 사이의 강력한 분리(separation)를 증명하여 기존 학계의 질문을 해결했습니다.
ASTEROID: 분자 역학의 다단계 시계열 예측을 위한 시공간 정보 트랜스포머
ASTEROID는 분자 역학(MD) 시뮬레이션의 계산 비용을 줄이기 위해 개발된 시공간 정보 트랜스포머 프레임워크입니다. 다단계 원자 좌표를 직접 예측하며, 로컬-글로벌 셀프 어텐션을 통해 복잡한 시공간 의존성을 효과적으로 모델링합니다.
순위 상관관계(Ranking Correlation) 및 최근접 이웃(Nearest Neighbor)을 이용한 일 클래스 분류(One-class
모든 머신러닝 모델을 일 클래스 분류(OCC) 모델로 근사하여 모델 자체를 분류하는 메타 분류 방법을 제안합니다. 정상성 순위와 최근접 이웃 지표를 활용해 데이터셋, 알고리즘, 하이퍼파라미터를 식별하는 연구입니다.
신뢰할 수 있는 LLM 추론을 위한 은닉 상태(Hidden States) 정제 학습
LLM의 은닉 상태 오류가 추론 불안정성을 초래하는 문제를 해결하기 위해 ReLAR 프레임워크를 제안합니다. 강화 학습을 통해 은닉 표현을 반복적으로 정제하여, 명시적인 사고 사슬(CoT) 없이도 효율적이고 정확한 추론을 가능하게 합니다.
MGUP: 확률적 최적화(Stochastic Optimization)를 위한 모멘텀-그래디언트 정렬 업데이트 정책
MGUP는 대규모 언어 모델 학습의 효율성을 높이기 위해 파라미터별로 단계 크기를 다르게 적용하는 새로운 확률적 최적화 메커니즘을 제안합니다. AdamW, Lion 등 기존 최적화 도구와 결합이 가능하며, 이론적 수렴 보장과 함께 다양한 학습 작업에서 우수한 성능을 입증했습니다.
과학적 머신러닝 (SciML) 대리 모델의 도메인 유효성 게이트 기반 메타모픽 테스팅
과학적 머신러닝(SciML) 대리 모델의 신뢰성을 검증하기 위해 도메인 유효성을 기반으로 한 메타모픽 테스팅 프레임워크를 제안합니다. 오라클 문제 해결을 위해 후보 관계를 선별하는 루브릭과 실행 가능한 테스트 자산 형식을 연구합니다.
뉴욕시 혼잡 통행료 도입 이후 대중교통 이득 및 공간적으로 불균등한 통행 수요 변화
뉴욕시의 혼잡 통행료 도입에 따른 도시 이동성 변화를 시계열 파운데이션 모델로 분석한 연구입니다. 정책 시행 후 대중교통 이용은 증가하고 전체 통행량은 감소했으나, 이러한 효과는 지역별로 불균등하게 나타났습니다.
위상적 정규화 (Topological Regularisation)를 이용한 비음수 행렬 분해 (Non-negative Matrix
지속성 호몰로지(Persistent Homology)를 활용하여 비음수 행렬 분해(NMF)에서 해석 가능한 기저를 학습하는 새로운 정규화 방법을 제안합니다. 기존 방식의 이산성과 임계값 의존성 문제를 해결하여 연속적인 최적화가 가능하도록 설계되었습니다.
오프라인 선호도 기반 궤적 평가 (Offline Preference-Based Trajectory Evaluation)
에이전트 시스템의 오프라인 평가 시 발생하는 정보 손실과 동점 문제를 해결하기 위해 시간적 선호도를 활용한 궤적 평가 방식을 제안합니다. 실험 결과, 기존 성공 기반 지표보다 동점 발생률을 낮추어 변별력과 데이터 효율성을 크게 향상시켰습니다.
심층 강화학습 (Deep Reinforcement Learning)을 통한 연속 시간 최적 정지 (Continuous-time Optimal
연속 시간 최적 정지 문제를 해결하기 위해 심층 강화학습 기반의 새로운 알고리즘인 CARLOS를 제안합니다. 이 알고리즘은 시공간 결정 경계를 학습하여 기존 이산화 방식의 오차를 극복하고 높은 계산 효율성을 달성합니다.
역전 Q-러닝 (Reversal Q-Learning)
Flow matching 기술을 활용하여 오프라인 강화학습을 수행하는 새로운 알고리즘인 Reversal Q-learning(RQL)을 제안합니다. Flow 정제 단계를 MDP의 행동으로 취급하는 확장된 프레임워크를 통해 기존 flow 기반 RL의 한계를 극복했습니다.
지리적 임계점 조기 경보를 위한 시공간 인과 네트워크 진단 (SpatioTemporal Causal Network Diagnostics)
지리적 임계점의 조기 경보를 위해 시공간 인과 네트워크 진단(ST-CND) 프레임워크를 제안합니다. 전이 엔트로피와 동적 모드 분해를 활용하여 기존 공간 지표의 한계를 극복하고, 데이터 기반의 정보 흐름을 통해 취약한 서브네트워크를 식별합니다.
AoiZora: Diffusion Transformer 추론을 위한 토폴로지 인식 자동 병렬 최적화
AoiZora는 비디오 확산 모델의 저지연 추론을 위해 TPU 서브 슬라이스의 물리적 토폴로지를 인식하여 자동 병렬화를 최적화하는 컴파일러 기반 플래너입니다. 논리적 샤딩과 물리적 배치를 정렬함으로써 기존 시스템이 놓치던 성능 향상 기회를 포착합니다.
부스팅에서의 잔차 직교화를 통한 학습기 중복성 감소
부스팅 프레임워크에서 발생하는 학습기 중복성 문제를 해결하기 위해 잔차 직교화 방식인 SCBoost를 제안합니다. SRP와 CRW 메커니즘을 통해 잔차 타겟을 투영하고 공분산을 규제하여 앙상블의 효율성을 높입니다.
다이내믹스 모델이 잘못된 타임스텝을 읽을 때: 강건한 글로벌 리드아웃을 위한 레이블 없는 이벤트 크레딧 재앵커링 (Label-Free
다이내믹스 모델이 물리적 이벤트를 정확히 포착하지 못하고 배경 정보에 의존하는 '시간적 크레딧 희석' 문제를 분석합니다. 이를 해결하기 위해 레이블 없이도 이벤트 코어를 재앵커링하여 정확도를 높이는 CREST 방법론을 제안합니다.
궤적 직선도(Trajectory Straightness)를 통한 Rectified Flows의 루트 선택형 고정점 역변환
Rectified Flows 기반의 이미지 편집을 위해 궤적 직선도를 기준으로 최적의 고정점 해를 선택하는 SelFix 방법을 제안합니다. 기존 고정점 역변환의 한계를 극복하여 더 직선적인 역궤적을 유도함으로써 이미지 재구성 및 편집 성능을 향상시켰습니다.
SPHERE-JEPA 확장: 하이퍼스피어(Hypersphere)를 위한 통계적 정규화 기법군
자기지도학습(SSL)에서 표현 붕괴를 방지하기 위해 사용되는 슬라이스 통계적 정규화의 확률적 불안정성을 해결하는 연구입니다. 무작위 투영 대신 결정론적인 MMD, KSD, KL 발산 기반의 전차원 목적 함수를 제안하여 최적화 안정성과 성능을 높였습니다.
사전 미세 조정 예측을 위한 리스크 분해 프레임워크 (A Risk Decomposition Framework for Pre-Hoc
LLM 미세 조정 비용 절감을 위한 사전 성능 예측의 이론적 한계를 탐구합니다. 예측 리스크를 내재적 한계와 최적화 분산으로 분해하여 예측 가능성의 근본적인 제약을 증명하고, 효율적인 예산 최적화 탐색 원칙을 제시합니다.
이 피드 구독하기
본 페이지의 콘텐츠는 AI가 공개된 소스를 기반으로 자동 수집·요약·번역한 것입니다. 원 저작권은 각 원저작자에게 있으며, 각 게시물의 “원문 바로가기” 링크를 통해 원문을 확인할 수 있습니다. 저작권자의 삭제 요청이 있을 경우 신속히 조치합니다.