Insights
AI가 자동으로 큐레이션·번역·정리하는 기술 동향 피드입니다.
arXiv cs.LG (Machine Learning) 112건필터 해제
FAME: 메시지 수준 로그 이상 탐지를 위한 장애 인지형 Mixture-of-Experts
FAME은 LLM을 활용하여 로그 메시지 수준의 이상 탐지를 수행하는 Mixture-of-Experts 프레임워크입니다. 레이블링 비용을 최소화하면서도 장애 도메인을 분할하여 정밀한 이상 탐지를 가능하게 합니다.
매칭 원리: 불필요한 변수에 강건한 표현 학습을 위한 손실 함수의 기하학적 이론
본 논문은 강건성, 도메인 적응 등 다양한 AI 문제들이 불필요한 변수의 공분산을 추정하고 인코더 자코비안을 정규화하는 하나의 통계적 문제임을 주장합니다. '매칭 원리'를 통해 기존 기법들의 구조적 공통점을 규명하고, 선형-가우시안 모델에서의 최적성을 수학적으로 증명합니다.
LCGuard: 멀티 에이전트 시스템 내 안전한 KV 공유를 위한 잠재 통신 가드 (Latent Communication Guard)
멀티 에이전트 시스템에서 KV 캐시를 통한 잠재 통신 시 발생할 수 있는 민감 정보 유출 문제를 해결하기 위한 LCGuard 프레임워크를 제안합니다. 적대적 학습을 통해 작업 관련 의미론은 보존하면서도 민감한 정보의 재구성을 방지하는 변환 기술을 다룹니다.
볼록 완화 (Convex Relaxations)를 통한 토큰화 (Tokenisation)
기존의 탐욕적 알고리즘 대신 선형 계획법과 볼록 최적화를 활용한 새로운 토큰화 알고리즘 ConvexTok을 제안합니다. ConvexTok은 BpB 지표를 개선하며, 토크나이저가 최적값에 얼마나 근접했는지 수학적으로 인증할 수 있는 기능을 제공합니다.
보존적 및 비보존적 표류 모델(Drifting Models)에 대한 유한 입자 수렴 속도
단일 단계 생성 모델링을 위한 보존적 표류(conservative drifting) 방법론을 제안하고 그 수렴 속도를 수학적으로 분석합니다. 기존 변위 기반 방식의 비보존성 문제를 해결하기 위해 KDE 기울기 속도를 도입하였으며, 유한 입자 수렴 경계와 최적화된 수렴 속도를 증명합니다.
신경 수요 포텐셜을 통한 적분 가능한 탄력성 (Integrable Elasticity via Neural Demand Potentials)
다중 제품 소매 수요 예측을 위한 새로운 신경망 모델인 ICDN을 제안합니다. 로그 수요를 로그 가격의 매끄러운 함수로 학습하여 정확한 탄력성 도출이 가능하며, 기존 벤치마크 대비 우수한 일반화 성능을 보여줍니다.
MOSS: 자율 에이전트 시스템에서의 소스 레벨 재작성을 통한 자기 진화 (Self-Evolution)
MOSS는 텍스트 기반의 기존 자기 진화 에이전트 한계를 넘어, 소스 코드 레벨에서 직접 재작성을 수행하는 자율 에이전트 시스템입니다. 운영 중 발생하는 구조적 실패를 해결하기 위해 결정론적 파이프라인과 외부 코딩 에이전트를 활용하여 에이전트의 성능을 스스로 개선합니다.
호기심을 유지하는 법: 3D 탐사를 위한 에피소드 문맥(Episodic Context) 및 지속적인 세계(Persistent Worlds)
3D 환경 내 장기적 탐사 과제를 해결하기 위해 에피소드 문맥과 지속적인 세계 모델을 결합한 새로운 강화학습 방법을 제안합니다. 온라인 3D 재구성을 통해 공간적 지속성을 확보하고 시퀀스 모델로 에피소드 이력을 유지하여 탐사 효율을 극대화했습니다.
벡터 정책 최적화 (Vector Policy Optimization): 다양성을 위한 학습이 테스트 시간 탐색 (Test-Time
LLM이 추론 시간 탐색(test-time search)에서 필요한 다양성을 확보할 수 있도록 돕는 새로운 RL 알고리즘인 VPO를 제안합니다. 기존의 스칼라 보상 최적화 방식 대신 벡터 보상을 활용하여 다양한 솔루션을 생성하도록 모델을 학습시킵니다.
다항식 극대화 밀도 추정을 통한 분산 감소 매니폴드 샘플링
본 연구는 암시적으로 정의된 매니폴드 상에서의 균등 샘플링 문제를 다루며, 기존 방법(MASEM)의 밀도 추정 오차를 개선하는 것을 목표로 합니다. 제안된 PMM-MASEM 모듈은 플러그인 밀도 규칙을 대체하기 위해 다항식 극대화 모멘트 추정기(Polynomial-maximization moment estimator)를 사용합니다. 이 모듈은 쉘 간격의 표준화된 누적 모멘트를 계산하고, 특정 조건에서 PMM2/PMM3 추정기를 게이트 방식으로 적용하여 밀도 MSE를 감소시키는 효과를 보였습니다.
계정 공모 상황에서의 멀티 테넌트 RAG 프라이버시 감사
멀티 테넌트 RAG 서비스에서 계정별 차분 프라이버시(DP)를 보장하더라도, 여러 계정이 공모할 경우 프라이버시 경계가 급격히 악화될 수 있음을 식별했습니다. 본 연구는 이러한 공모 공격을 실현하는 방법과 RAG 특화 멤버십 추론 공격(MIA)을 제시하며, 기존 인프라를 수정하지 않고도 검색 채널의 프라이버시를 정량적으로 검증할 수 있는 최초의 감사 프로토콜을 제안합니다.
다중 도메인 단백질-리간드 결합을 위한 계층적 대조 학습 (Hierarchical Contrastive Learning)
HCLBind는 다중 도메인 단백질의 결합 친화도 예측을 위해 기하학적 표현 학습과 친화도 회귀를 분리한 자기지도 학습 프레임워크입니다. 계층적 디코이 전략을 통해 국소적 물리화학적 제약과 전역적 형태 기하학을 동시에 학습하며, 도메인 게이트 그래프 어텐션 네트워크를 통해 도메인 인터페이스를 효과적으로 포착합니다.
JAXenstein: 1인칭 환경을 위한 가속화된 벤치마킹
JAXenstein은 시각적 1인칭 작업을 테스트하기 위해 Wolfenstein 3D 렌더링 엔진을 JAX 기반으로 구현한 오픈 소스 벤치마크입니다. 기존 비전 기반 벤치마크보다 훨씬 빠른 속도를 제공하며, 강화학습 에이전트의 탐색 및 부분 관측 가능성 극복 능력을 효율적으로 검증할 수 있도록 설계되었습니다.
DAG 구조 학습에서 비음성(Non-Negativity)의 활용
본 연구는 선형 구조 방정식 모델을 기반으로 유향 비순환 그래프(DAG)를 학습할 때, 에지 가중치를 비음수(non-negative)로 제한하여 최적화 문제를 해결하는 새로운 방법을 제안합니다. 비음성 제약을 통해 기존의 복잡한 비볼록 최적화 지형을 개선하여, 실제 DAG가 유일한 전역 최소화 지점이 되는 양호한 최적화 지형을 확보했습니다. 실험 결과, 제안된 알고리즘은 기존의 최신 연속 DAG 학습 방식보다 뛰어난 성능을 입증했습니다.
국소적 가소성(Local Plasticity) 및 수지상 돌기 계산(Dendritic Computation)을 통한 음원 분리용 규범적 네트워크
본 연구는 생물학적으로 타당한 국소적 가중치 업데이트만을 사용하여 블라인드 음원 분리(BSS)를 수행하는 '예측 엔트로피 최대화(Predictive Entropy Maximization)' 방법을 제안합니다. 수지상 돌기 메커니즘을 통한 오류 기반 규칙과 국소적 헤브 가소성을 결합하여, 복잡한 비국소적 역학 없이도 높은 성능과 견고함을 달성했습니다.
이웃이 알고 있다: 분산 학습 (Decentralized Learning)에서의 백도어 탐지를 위한 로컬 이웃 활용법
분산 학습(Decentralized Learning) 환경에서 중앙 서버 없이도 백도어 공격을 탐지할 수 있는 새로운 프레임워크인 Argus를 제안합니다. Argus는 노드들이 로컬에서 모델 업데이트를 분석하고 이웃과 트리거 정보를 공유함으로써, 데이터 이질성으로 인한 오탐을 줄이고 일관된 악의적 패턴을 식별합니다. 실험 결과, Argus는 모델의 유용성을 유지하면서도 공격 성공률을 최대 90%까지 낮추는 탁월한 방어 성능을 입증했습니다.
함수 공간을 위한 정규직교 기저 학습
본 논문은 고정된 Fourier나 웨이브릿 기저의 한계를 극복하기 위해 신경망을 사용하여 데이터에 적응 가능한 무한 차원 정규직교 기저를 학습하는 방법을 제안합니다. 직교군(orthogonal group)의 Lie 다양체 상의 경로를 상미분 방정식(ODE)으로 모델링하고, 유한 계수 생성자를 통해 이를 매개변수화하여 최적화할 수 있음을 보여줍니다. 연구 결과, 낮은 계수의 생성자만으로도 어떠한 목표 정규직교 기저에도 근사할 수 있는 보편성을 증명하였습니다.
이진적 성공을 넘어: 미세 조작(Fine-Grained Manipulation)을 위한 진단적 메타 평가 프레임워크
기존 Embodied AI 벤치마크가 성공 여부를 이진적 수치로만 평가하여 실제 성능을 왜곡하는 문제를 해결하기 위해, 미세 조작 능력을 진단할 수 있는 MetaFine 프레임워크를 제안합니다. MetaFine은 이해, 인지, 제어된 행동의 세 축을 기반으로 복잡한 시나리오를 재구성하여 VLA 모델의 구체적인 실패 지점을 식별합니다. 연구 결과, 시각 인코더의 국소 공간 구조 보존 능력이 미세 조작의 핵심 병목임을 밝혀냈으며, 이를 통해 물리적 숙련도를 향상시킬 수 있는 방향을 제시합니다.
손실 적응형 학습률을 통한 망각 없는 미세 조정 (Fine-Tuning Without Forgetting via Loss-Adaptive
대규모 언어 모델(LLM) 미세 조정 시 발생하는 치명적 망각(Catastrophic forgetting) 문제를 해결하기 위해, 손실 값에 따라 학습률을 조절하는 FINCH 기법을 제안합니다. FINCH는 손실이 높은 배치에서는 학습률을 낮추고 모델이 수렴함에 따라 높이는 손실 적응형 학습률 스케줄을 사용하여, 기존 지식을 보존하면서도 새로운 작업 성능을 유지합니다. 실험 결과, FINCH는 표준 미세 조정 대비 망각을 평균 93% 감소시키며 뛰어난 지식 보존 능력을 입증했습니다.
미니멀리스트 시각 관성 오도메트리 (Minimalist Visual Inertial Odometry)
본 연구는 모바일 로봇의 내비게이션을 위해 단 4개의 포토다이오드와 IMU만을 사용하는 미니멀리스트 시각 관성 오도메트리(VIO) 방식을 제안합니다. 광학 Gabor 마스크를 통해 속도 신호를 생성하고 Temporal Convolutional Network(TCN)를 통해 이를 디코딩함으로써, 복잡한 카메라 이미지 처리 없이도 견고한 평면 궤적 추정이 가능함을 입증했습니다.
이 피드 구독하기
본 페이지의 콘텐츠는 AI가 공개된 소스를 기반으로 자동 수집·요약·번역한 것입니다. 원 저작권은 각 원저작자에게 있으며, 각 게시물의 “원문 바로가기” 링크를 통해 원문을 확인할 수 있습니다. 저작권자의 삭제 요청이 있을 경우 신속히 조치합니다.