© 2026 Molayo

Insights

AI가 자동으로 큐레이션·번역·정리하는 기술 동향 피드입니다.

arXiv cs.LG 1862건필터 해제

언어 에이전트의 개방형 다중 에이전트 협업(Open-Ended Multi-Agent Coordination) 벤치마킹

언어 모델 에이전트의 장기적 협업 능력을 평가하기 위한 새로운 벤치마크인 $alem$을 소개합니다. JAX 기반의 이 환경은 탐험, 제작, 거래 등 복잡한 생존 과제를 통해 LLM의 협업 역량을 측정하며, 개별 작업 능력과 협업 능력이 별개임을 입증합니다.

GENERIC-FNO: 푸리에 신경 연산자(Fourier Neural Operators)에 에너지 보존 및 엔트로피 생성 임베딩하기

GENERIC-FNO는 비평형 열역학의 에너지 보존 및 엔트로피 생성 구조를 함수 공간에 직접 임베딩한 최초의 신경 연산자입니다. 기존 모델과 달리 설계 단계에서 퇴화 조건을 강제하여 물리적 일관성을 머신 정밀도 수준으로 유지하며, 다양한 PDE 문제에서 뛰어난 성능을 보입니다.

공변량 의존적 도착 하에서의 적응형 동료 추천 채용을 위한 생성적 프런티어 계획 (Generative Frontier Planning)

동료 추천 채용 시스템에서 동종 선호성을 고려하여 자원을 효율적으로 할당하는 '생성적 프런티어 계획(GFP)' 알고리즘을 제안합니다. 기존 i.i.d. 가정을 탈피하여 추천자와 피추천자 간의 공변량 의존성을 모델링하고, 결정론적 백업과 수확 체감 구조를 통해 최적의 계획을 수립합니다.

희소 오토인코더 (Sparse Autoencoder) 스티어링 부작용의 개입 전 예측

희소 오토인코더(SAE)를 이용한 언어 모델 스티어링 시 발생하는 부작용을 개입 전에 예측하는 프레임워크를 제안합니다. 모델과 사전 설정에 따라 효과 안정성과 부수적 확산 측면에서 예측 가능한 특징 시그니처를 분석했습니다.

SoK: 합성 정형 데이터에 대한 재구성 공격 (NIST CRC 우승 사례를 통한 통찰)

합성 정형 데이터에 대한 재구성 공격을 체계적으로 분석한 연구입니다. 공격 분류 체계와 새로운 공격 기법인 CoBP-RA를 제안하며, NIST CRC에서 1위를 차지하며 그 유효성을 검증받았습니다.

개방형 학습 (Open-Ended Learning)을 위한 정보 이론적 정의

개방형 환경에서 AI의 지속적인 능력 확장을 위한 정보 이론적 정의를 제안합니다. '비트 등가(bit-equivalent)'라는 새로운 개념을 통해 환경의 개방성을 정량화하고, 이를 달성하기 위한 알고리즘을 소개합니다.

근사 구배(Proximal Gradients)를 통한 베이지안 사전 확률(Bayesian Priors) 기반의 예측 코딩(Predictive

예측 코딩(Predictive Coding)을 연속 시간 근사 구배 하강법을 통해 MAP 목적 함수로 재구성하는 연구입니다. 단일 및 다계층 구조에서 근사 구배가 누설 발화율 네트워크와 계층적 예측 코딩을 어떻게 도출하는지 수학적으로 증명합니다.

전원자 Flow Map을 이용한 소수 단계 공동 접힘 (Few-step Cofolding)

DeCAF는 전원자 공동 접힘(all-atom cofolding) 모델을 소수의 추론 단계만으로 고품질 샘플을 생성하도록 증류하는 새로운 프레임워크입니다. SE(3) 강체 정렬을 지원하는 디노이저 기반 flow map을 통해 계산 비용을 획기적으로 줄이면서도 높은 정확도를 유지합니다.

RiskNet: 뉴스 기반 AI 리스크 사건의 정렬 및 다차원 주석을 포함한 대규모 데이터셋

AI 리스크 사건을 추적하고 분석하기 위해 뉴스 데이터를 기반으로 구축된 대규모 다국어 데이터셋 RiskNet을 소개합니다. RiskNet은 뉴스 식별부터 사건 정렬, 다차원 분류까지 이어지는 구조화된 파이프라인을 통해 AI 안전 및 거버넌스 연구를 위한 실증적 자원을 제공합니다.

TT-DAC-PS: 최적 거래 실행을 위한 정책 평활화(Policy Smoothing)를 포함한 쌍-타겟 결정론적

주식 매도 프로그램의 최적 실행을 위해 정책 평활화와 쌍-타겟 기술을 결합한 TT-DAC-PS 아키텍처를 제안합니다. 강화학습 기반의 이 모델은 기존 PPO, SAC 및 전통적인 거래 알고리즘보다 우수한 실행 성능을 입증했습니다.

STAR-KV: 적응형 랭크 제어를 위한 소프트 임계값 기반의 저차원 (Low-Rank) KV 캐시 압축

STAR-KV는 은닉 차원의 중복성을 활용하여 KV 캐시를 압축하는 적응형 저차원 투영 프레임워크입니다. 미분 가능한 임계값 메커니즘과 하이브리드 분해 전략을 통해 정확도 저하를 최소화하면서도 높은 압축률을 달성합니다.

Muon의 스펙트럼 역학 및 노이즈 기하학

Muon 최적화 알고리즘의 스펙트럼 역학 및 노이즈 기하학을 분석한 연구입니다. Muon이 행렬 그래디언트를 극 분해 인자로 대체하여 업데이트 스펙트럼을 평탄하게 만드는 원리와 그에 따른 최적화 편향을 증명합니다.

신경망 상호작용 발견은 언제 실제인가? 식별 가능성(Identifiability), 회복 가능성(Recoverability), 그리고 사전

신경망 시계열 모델에서 발견된 변수 간 상호작용이 데이터의 실제 속성인지 모델의 인위적 결과인지 분석합니다. 연구는 상호작용의 식별 가능성이 모델 구조보다 입력 데이터의 기하학적 구조에 달려 있음을 증명합니다.

선제적 대화형 질의를 활용한 증명 가능한 효율성을 갖춘 개인화된 다중 목적 밴딧 (Personalized Multi-Objective

사용자의 선제적 대화형 질의를 활용하여 다중 목적 밴딧(Multi-objective bandits)의 개인화된 의사결정을 최적화하는 새로운 프레임워크를 제안합니다. 질의 기반 선호도 앵커링과 이중 탐색 UCB를 결합한 MO-PQUCB 알고리즘을 통해 선호도 추정 속도와 후회 스케일링을 개선했습니다.

Sparrow: 대규모 언어 모델의 안정적이고 효율적인 긴 문맥 RL을 위한 희소 롤아웃 (Sparse Rollout)

RLVR 학습 시 긴 문맥 생성 비용을 줄이기 위해 희소 롤아웃(Sparse Rollout)을 활용하는 연구입니다. 토큰별 액터-정책 불일치 통계량을 일정하게 유지하는 동적 스케줄링을 통해 학습 안정성을 확보하고 롤아웃 속도를 최대 2.4배 향상했습니다.

훈련 인지형 조건부 확산 모델(Conditional Diffusion Models)을 통한 베이지안 최적화(Bayesian

베이지안 최적화에서 전역 최적해의 분포를 근사하기 위해 조건부 확산 모델(CDM)을 활용하는 새로운 연구를 소개합니다. 기존 가우시안 프로세스 샘플링의 높은 계산 비용 문제를 해결하며, 확산 기반 모드 탐색(DMS) 전략을 통해 성능을 입증했습니다.

Drift-Plus-Penalty를 통한 지속 학습 (Continual Learning)의 이론적 토대

본 논문은 지속 학습(Continual Learning)의 치명적 망각 문제를 해결하기 위해 제어 이론적 관점을 도입한 COLD 프레임워크를 제안합니다. Drift-Plus-Penalty 원칙을 활용하여 안정성과 가소성 사이의 트레이드오프를 동적으로 조절하며, 기존 방법론보다 우수한 성능을 입증했습니다.

단 한 번만이 아니다: 수면에서 영감을 얻은 리플레이(Replay)는 연속적인 작업 후의 치명적 망각(Catastrophic

인공 신경망의 치명적 망각 문제를 해결하기 위해 수면 중 리플레이 과정을 모방한 비지도 학습 방식을 제안합니다. 여러 작업을 순차적으로 학습한 후 리플레이 단계를 거치면 이전 작업의 성능을 복구할 수 있음을 보여줍니다.

신뢰의 함정: 그래프 신경망 (GNN)을 위한 캘리브레이션 공격

그래프 신경망(GNN)의 신뢰도 캘리브레이션 강건성을 분석하기 위한 새로운 공격 프레임워크인 UGCA를 제안합니다. 이 연구는 그래프의 이산적 특성과 에지 섭동 민감도 문제를 해결하며, 모델의 일반화 성능과 캘리브레이션 취약성 사이의 관계를 이론적으로 규명합니다.

LOTTERY: 크기 비대칭이 존재하는 이표본 검정(Two-Sample Testing)에서의 참조 전용 샘플(Reference-Only

샘플 크기가 불균형한 퓨샷(few-shot) 환경에서 두 샘플의 분포 동일성을 평가하는 새로운 이표본 검정 방법을 제안합니다. 풍부한 참조 데이터를 활용해 참조 의존적 표현을 학습하고, 불확실성 가이드 원칙을 통해 검정력을 극대화합니다.

이 피드 구독하기

RSSFeedly, Inoreader 등으로 구독

API/api/search?q=검색어

AIllms.txt로 AI 크롤링 가이드

본 페이지의 콘텐츠는 AI가 공개된 소스를 기반으로 자동 수집·요약·번역한 것입니다. 원 저작권은 각 원저작자에게 있으며, 각 게시물의 “원문 바로가기” 링크를 통해 원문을 확인할 수 있습니다. 저작권자의 삭제 요청이 있을 경우 신속히 조치합니다.