Insights
AI가 자동으로 큐레이션·번역·정리하는 기술 동향 피드입니다.
arXiv cs.LG 1862건필터 해제
Hölder 공간에서의 Deep Q-Learning
연속 시간 확률 제어 환경에서 Q-learning의 연산자 이론적 핵심을 연구합니다. Bellman 업데이트가 상태 변수를 매끄럽게 만드는 정칙성 특성을 분석하고, 이를 바탕으로 DeepONet 아키텍처를 활용한 근사 복잡도와 자원 경계를 도출합니다.
HawkesNest: 시공간 패턴 복잡성을 위한 다축 합성 벤치마크
HawkesNest는 시공간 점 과정(STPP) 모델의 성능을 정밀하게 평가하기 위해 제어 가능한 복잡성을 가진 생성형 벤치마크를 제안합니다. 공간-시간 얽힘, 배경 이질성 등 네 가지 축을 통해 모델의 구조적 취약성을 진단할 수 있습니다.
통합 마케팅 기여도 산정: MMM에 기반한 프라이버시 보호형 세밀한 측정을 위한 베이지안 프레임워크
MMM의 프라이버시 보호 능력과 MTA의 세밀한 분석 장점을 결합한 통합 마케팅 기여도(IMA) 프레임워크를 제안합니다. 베이지안 프레임워크를 통해 MMM의 사전 정보를 활용함으로써, 개인정보를 보호하면서도 캠페인 수준의 정밀한 효과 측정이 가능합니다.
가중치와 그래디언트를 넘어: 연합 학습 메시지의 분류 체계
연합 학습(Federated Learning)에서 가중치와 그래디언트를 넘어 합성 데이터 및 연합 분석을 포함하는 새로운 메시지 분류 체계를 제안합니다. 유용성과 프라이버시를 기준으로 메시지를 세 가지 범주로 정의하고, 통신 비용 및 보안 위험에 따른 트레이드오프를 분석합니다.
국소적 강건성(Local Robustness)과 안정성(Stability)을 통한 딥러닝 모델의 일반화 오차(Generalization
딥러닝 모델의 일반화 오차를 더 정확하게 예측하기 위해 국소적 강건성과 안정성을 결합한 새로운 일반화 경계를 제안합니다. 기존 방식의 공허함 문제를 해결하여 실제 오차율에 더 가까운 타이트한 상한선을 도출합니다.
환상적인 사전 학습 최적화 도구와 그 발견처 II: Hyperball 최적화
Muon과 같은 행렬 기반 최적화 도구의 효율성을 높이기 위해 제안된 Hyperball 최적화 도구에 관한 연구입니다. 가중치와 업데이트의 프로베니우스 노름을 고정하여 AdamW 대비 성능 저하 문제를 해결하고 학습 속도를 향상시킵니다.
인수분해된 신경 연산자(Factorized Neural Operators)를 통한 동적 및 지속적 응답의 분해
물리 시스템의 이질적인 역학을 포착하기 위해 스펙트럼 표현을 등변 동적 응답과 불변 지속적 응답으로 분해하는 FaNO(Factorized Neural Operators)를 제안합니다. 이 방식은 단일 귀납 편향의 한계를 극복하여 예측 정확도와 일반화 성능을 크게 향상시킵니다.
LLM의 회로 발견(Circuit Discovery)에서 나타나는 분산(Variance)의 실체 규명
LLM의 회로 발견(Circuit Discovery) 과정에서 발생하는 세 가지 주요 분산(재샘플링, 재구문, 샘플별 분산)의 원인을 규명합니다. 새로운 방법론인 CEAP를 통해 재샘플링 분산을 줄일 수 있음을 입증하고, 프롬프트 템플릿 변화가 회로 활성화에 미치는 영향을 분석합니다.
CrossMaps: 로버 내비게이션을 위한 신뢰도 인식 오픈 보캐블러리 (Open-Vocabulary) 시맨틱 매핑
CrossMaps는 로버 내비게이션을 위해 RGB-D 데이터로부터 언어 질의가 가능한 시맨틱 지도를 구축하는 실시간 파이프라인입니다. CLIP 임베딩과 이중 메모리 아키텍처를 활용하여 센서 신뢰도를 인식하고 일관된 시맨틱 랜드마크를 생성합니다.
강화학습 (RL) 내 분포 변화 (Distributional Shifts)의 통합된 인과적 기원 분류 체계
강화학습(RL)에서 발생하는 분포 변화(Distributional Shifts)의 원인을 인과적으로 분류하는 통합 체계를 제안합니다. ID/OOD 일반화와 비정상성 설정을 생성적 상호작용 관점에서 재정의하여 에이전트와 환경 주도의 변화를 구분합니다.
유령과 공개: 합성 데이터 감사를 위한 인과적 프레임워크
합성 데이터 생성 시 발생할 수 있는 개인정보 유출 위험을 탐지하기 위한 새로운 인과적 감사 프레임워크를 제안합니다. 실제 데이터의 직접적 재현과 부수적 생성을 구분하여 프라이버시 노출 정도를 통계적으로 검증합니다.
적응형 표현을 이용한 함수적 경사 하강법 (Functional Gradient Descent with Adaptive
함수 공간에서 직접 경사를 하강하는 FGD의 구현 한계를 극복하기 위해, 최적화 과정 중 표현을 적응시키는 새로운 알고리즘을 제안합니다. 이 방법은 이론적 수렴성을 보장하며 회귀, PDE, 컴퓨터 비전 분야에서 기존 방식보다 뛰어난 성능을 입증했습니다.
확률적 단일 분자 신호로부터 해석 가능한 구조적 좌표의 잠재 공간 매핑
나노포어 센서의 확률적 신호 왜곡 문제를 해결하기 위해 물리 정보 기반 모델과 대조 학습을 결합한 새로운 인코더를 제안합니다. 이 모델은 신호를 해석 가능한 분자 좌표계로 매핑하여 계산 비용을 1,000배 절감하고 데이터 풀링을 가능하게 합니다.
매개변수적 적분 확률 메트릭 (Parametric Integral Probability Metric)을 이용한 비매개변수적 이표본 검정
매개변수적 판별기 클래스를 활용하여 적분 확률 메트릭(IPM) 기반의 새로운 비매개변수적 이표본 검정 통계량을 제안합니다. PReLU-TST는 이론적 일관성을 갖추며, 시뮬레이션 결과 기존 모델 대비 높은 검정력을 입증했습니다.
대규모 언어 모델(LLM) 해석을 위한 확장 가능한 회로 학습
LLM의 동작 원리를 규명하기 위해 희소 회로를 효율적으로 학습하는 CircuitLasso를 제안합니다. SAE 특징의 높은 차원성 문제를 해결하여 기존 방식보다 적은 계산 비용으로 정확한 회로를 복구합니다.
테스트 시간 학습(Test-Time Training)에 대한 의사결정론적 관점: 언제, 얼마나 멀리, 그리고 어떤 방향으로 적응할 것인가
테스트 시간 학습(TTT)의 불안정성을 의사결정론적 관점과 암묵적 베이지안 추론으로 분석한 연구입니다. 가우시안 프로세스 벤치마크를 통해 업데이트 단계와 서브스페이스가 예측 오차에 미치는 영향을 규명하고, 최적의 적응 전략을 위한 이론적 가이드를 제시합니다.
명시적 불확실성 및 증거 충돌 모델링을 통한 감사 위험 평가용 멀티 에이전트 프레임워크
UMAR는 MD&A, 재무 비율, CAM 에이전트를 활용하여 감사 위험을 평가하는 멀티 에이전트 프레임워크입니다. Dempster-Shafer 이론을 통해 에이전트 간 증거 충돌과 불확실성을 정량화하여 기존 모델보다 높은 예측 성능과 해석력을 제공합니다.
AQ4SViT: Spiking Vision Transformer 압축을 위한 탐색 게이팅 정책 기반 자동 양자화 프레임워크
AQ4SViT는 저전력 Spiking Vision Transformer(SViT) 모델을 효율적으로 압축하기 위한 자동 양자화 프레임워크입니다. 탐색 게이팅 정책을 통해 정확도와 메모리 사이의 최적의 트레이드오프를 빠르게 찾아내며, 임베디드 AI 시스템 배포를 용이하게 합니다.
Greedy Coordinate Diffusion: 확산 가이던스(Diffusion Guidance)를 통한 효과적이고 의미론적으로 일관된
미세 조정 과정에서 언어 모델의 안전 가드레일이 파괴되는 '정렬 붕괴' 현상을 기하학적 관점에서 분석한 연구입니다. 파라미터 공간의 곡률과 2차 드리프트가 정렬 저하를 유발함을 증명하고, 이를 예측할 수 있는 정렬 불안정성 조건(AIC)을 제안합니다.
EIBench: 시뮬레이터 기반 벤치마크 및 감정 관리를 위한 Turn-Credit RL
상호작용적 감정 관리를 평가하기 위한 시뮬레이터 기반 벤치마크인 EIBench를 소개합니다. 2,222개의 시나리오를 통해 LLM의 정서 지능을 다회차 대화 관점에서 평가하며, 강화학습 알고리즘인 CTC-GRPO를 통해 모델의 성능을 크게 향상시켰습니다.
이 피드 구독하기
본 페이지의 콘텐츠는 AI가 공개된 소스를 기반으로 자동 수집·요약·번역한 것입니다. 원 저작권은 각 원저작자에게 있으며, 각 게시물의 “원문 바로가기” 링크를 통해 원문을 확인할 수 있습니다. 저작권자의 삭제 요청이 있을 경우 신속히 조치합니다.