본문으로 건너뛰기

© 2026 Molayo

Insights

AI가 자동으로 큐레이션·번역·정리하는 기술 동향 피드입니다.

arXiv논문

시련을 통과하기: 익숙한 환경을 넘어선 에이전트(Agents) 능력의 재평가

에이전트 시스템의 일반화 능력을 평가하기 위한 새로운 웹 기반 벤치마크인 GauntletBench를 소개합니다. 시간적 인지, 그래픽 이해, 3D 추론 등 기존 벤치마크가 간과했던 복잡한 시나리오를 통해 최첨단 에이전트의 한계를 분석합니다.

22시간 전0
arXiv논문

볼록 제약 조건(Convex Constraints)을 이용한 특징 일반화(Feature Generalization)를 위한 연합

연합 학습(FL)에서 발생하는 로컬 데이터 과적합과 특징 왜곡 문제를 해결하기 위해 FedCONST를 제안합니다. 볼록 제약 조건을 활용해 파라미터 업데이트를 적응적으로 조절함으로써 학습 안정성과 일반화 성능을 높입니다.

22시간 전0
arXiv논문

비선형 이중 시간 척도 확률 근사 (Nonlinear Two-Time-Scale Stochastic Approximation): 급격한 상전이

비선형 이중 시간 척도 확률 근사(TTSA)에서 수렴 속도를 결정하는 급격한 상전이 메커니즘을 분석합니다. 기존의 수정되지 않은 재귀식이 겪는 속도 저하 문제를 식별하고, 보조 온라인 편향 추정기를 도입하여 모든 조건에서 $O(k^{-1})$의 수렴 속도를 달성하는 방법을 제안합니다.

22시간 전0
arXiv논문

Mixture-of-Expert Transformers의 태스크 라우팅을 위한 이론적 모델

MoE 트랜스포머 모델에서 발생하는 태스크-전문가 특화 현상을 이산 언어 모델을 통해 이론적으로 규명한 연구입니다. 구문 템플릿과 키-값 사전을 활용하여 전문가가 지식을 인코딩하고 라우팅되는 메커니즘을 공식적으로 증명했습니다.

22시간 전0
arXiv논문

EM-NeSy: 신경기호학습 (Neurosymbolic Learning)을 위한 기대값 최대화 (Expectation Maximization)

신경망과 기호적 추론을 통합하는 신경기호학습(NeSy)을 위해 EM 알고리즘을 적용한 EM-NeSy 프레임워크를 제안합니다. 이 방식은 기호적 구성 요소의 미분 가능성 없이도 근사 추론을 통해 효율적인 학습을 가능하게 합니다.

22시간 전0
arXiv논문

구조적 지식 그래프 완성(Knowledge-Graph Completion)을 위한 레시피 제어 디코더 감사(Recipe-Controlled

구조적 지식 그래프 완성(KGC)을 위해 학습 레시피와 디코더 간의 상호작용을 분석하는 RCDA 방법론을 제안합니다. 실험을 통해 디코더 선택이 데이터셋 규모와 인코더 깊이에 따라 성능에 미치는 민감한 영향을 규명했습니다.

22시간 전0
arXiv논문

훈련 분포를 넘어서: 분포 변화(Distribution Shift) 및 선택 편향(Selection Bias) 하에서의 예측 평가

공변량 변화와 선택적 레이블링이 동시에 발생하는 환경에서 모델의 타겟 리스크를 정확히 추정하는 연구입니다. 이중 머신러닝 절차와 편향 수정 추정량을 제안하여 배포 전 모델 성능을 효과적으로 평가합니다.

22시간 전0
arXiv논문

PepALD: 자기회귀 잠재 확산(Autoregressive Latent Diffusion)을 통한 거대고리 펩타이드 생성

PepALD는 거대고리 펩타이드 생성을 위한 자기회귀 잠재 확산(ALD) 기반의 파운데이션 모델입니다. 화학적 임베딩과 문맥 조건부 확산을 통해 복잡한 화학적 구조를 정밀하게 생성하며, 선호도 최적화를 통해 결합 친화도를 높였습니다.

22시간 전0
arXiv논문

LLM 은닉 상태(Hidden States)에서의 코드 정확성 신호: 생성 전 프로빙(Probing) 및 수정 기하학(Repair

LLM의 은닉 상태(hidden states)를 분석하여 코드 생성 전 정확성을 예측하고, 실패한 코드를 수정할 때 발생하는 상태 변화를 탐구한 연구입니다. Qwen 모델을 통해 은닉 상태에서 코드 정확성 신호를 선형적으로 디코딩할 수 있음을 입증했습니다.

22시간 전0
arXiv논문

머신 언러닝 (Machine Unlearning)의 행동 감사 (Behavioral Audit)에는 프라이버시 비용이 따른다

머신 언러닝(MU)의 효과를 검증하는 감사 과정에서 발생하는 프라이버시 침해 문제를 다룹니다. 모델 소유자와 감사자 간의 불신 상황에서, 행동적 신호만으로는 데이터의 멤버십 정보를 보호하면서 불충분한 언러닝을 식별하기 어렵다는 프라이버시-감사 트레이드오프를 증명했습니다.

22시간 전0
arXiv논문

증명 가능한 안전성을 갖추면서도 확장 가능한 강화학습 (Provably Safe, Yet Scalable Reinforcement

기존 안전 강화학습의 확장성 문제를 해결하기 위해 설계된 PS2-RL 프레임워크를 소개합니다. 암시적 제어 불변 집합을 생성하는 2단계 아키텍처를 통해 증명 가능한 안전성을 유지하면서도 높은 성능과 확장성을 제공합니다.

22시간 전0
arXiv논문

Muon을 위한 자유로운 헤비 테일(Heavy-Tailed) 점심: 경험적 성공에 대한 이론적 정당화

Muon 및 Scion과 같은 비유클리드 최적화 방법론이 Transformer 학습에서 보여주는 성능의 이론적 근거를 제시합니다. 헤비 테일(heavy-tailed) 노이즈 환경에서 이 방법들이 유클리드 방식보다 차원 의존성 없이 최적의 샘플 복잡도를 달성함을 증명했습니다.

22시간 전0
arXiv논문

주성분 분석 (PCA)의 위험 그림자: 99.9999%의 분산 보존이 치명적인 의사결정 오류를 유발할 때

PCA가 분산을 보존하면서도 희귀하고 치명적인 사건의 신호를 삭제하는 '위험 그림자(Risk Shadow)' 현상을 분석합니다. 이를 해결하기 위해 고영향 사건에 가중치를 두는 ExPCA와 TP-PCA 방법론을 제안하며, 신용카드 사기 탐지 실험을 통해 그 유효성을 입증합니다.

22시간 전0
arXiv논문

ORCA: 오픈 소스 숙련도(Dexterity) 연구를 위한 플랫폼

로봇의 숙련된 조작(Dexterity) 연구를 지원하기 위한 오픈 소스 학습 스택인 ORCA를 소개합니다. 제어, 시뮬레이션, 원격 조작 및 리타겟팅을 단일 인터페이스로 통합하여 연구 효율성을 높였습니다.

22시간 전0
arXiv논문

NEST3D: 사회적 Weaver 새둥지의 고해상도 멀티모달 데이터셋

사회적 Weaver 새둥지의 복잡한 3D 구조를 분석하기 위한 1.4TB 규모의 고해상도 멀티모달 드론 데이터셋인 NEST3D를 공개합니다. RGB, 멀티스펙트럴 이미지 및 7억 8,100만 개의 3D 포인트를 포함하며, 다양한 세그멘테이션 모델의 성능을 벤치마킹합니다.

22시간 전0
arXiv논문

CANN-EUCLID: 전체 필드 데이터로부터의 비지도 구성 인공 신경망 모델 발견

CANN-EUCLID는 응력 데이터 없이 변위 필드와 반력만으로 재료의 구성 법칙을 식별하는 비지도 학습 프레임워크입니다. 기존의 응력 지도 방식과 달리 단일 하중 케이스에서도 희소성 촉진 정규화를 통해 해석 가능한 신경망 모델을 발견할 수 있습니다.

22시간 전0
arXiv논문

소비자용 GPU에서 Diffusion Transformer를 위한 네이티브 INT8 연산 구현: Ideogram 4.0을 위한 Fused

소비자용 Ampere GPU에서 Diffusion Transformer의 INT8 연산 속도를 최적화하기 위해 Fused Triton INT8 GEMM 커널을 구현했습니다. 기존의 역양자화 방식 대신 텐서 코어를 직접 활용하여 FP8 및 NF4보다 빠른 성능을 달성했습니다.

22시간 전0
arXiv논문

더 큰 도메인에 대한 트랜스포머 신경 연산자(Transformer neural operators)의 제로샷 일반화 (Zero-shot

트랜스포머 기반 신경 연산자가 훈련된 도메인보다 더 큰 공간 도메인에서도 제로샷 일반화가 가능하도록 하는 연구를 소개합니다. 분해 가능한 편향과 회전 위치 임베딩을 통해 공간적 국소성과 이동 등변성을 구현하여 PDE 해 연산 성능을 높였습니다.

22시간 전0
arXiv논문

수소 다중 에너지 시스템(H-MES)의 운영 임계값 탐지 및 배포 가능한 디스패치 컨트롤러 개발을 위한 통계 및 머신러닝 프레임워크

수소 다중 에너지 시스템(H-MES)의 운영 특성을 분석하고 최적의 디스패치 컨트롤러를 개발하기 위한 통계 및 머신러닝 프레임워크를 제안합니다. 통계적 분석과 랜덤 포레스트, 시퀀스 모델, 강화학습을 결합하여 시스템의 비선형 역학을 규명하고 수익을 최적화합니다.

22시간 전0
arXiv논문

병렬도 아니고 순차적도 아니다: DiffusionGemma가 실제로 토큰을 확정(Commit)하는 방식

DiffusionGemma 26B 모델의 토큰 확정(commit) 메커니즘을 분석하여, 이 모델이 완전한 병렬 방식이 아닌 좌측-우측 확정 편향을 따름을 밝혀냈습니다. 연구 결과, 모델의 블록 크기는 아키텍처 특성이 아닌 측정 입도에 따라 결정되는 산물임을 증명했습니다.

22시간 전0

이 피드 구독하기

본 페이지의 콘텐츠는 AI가 공개된 소스를 기반으로 자동 수집·요약·번역한 것입니다. 원 저작권은 각 원저작자에게 있으며, 각 게시물의 “원문 바로가기” 링크를 통해 원문을 확인할 수 있습니다. 저작권자의 삭제 요청이 있을 경우 신속히 조치합니다.