본문으로 건너뛰기

© 2026 Molayo

Insights

AI가 자동으로 큐레이션·번역·정리하는 기술 동향 피드입니다.

arXiv cs.AI 2012필터 해제

arXiv논문

LLM과 지식 그래프(Knowledge Graphs)를 활용한 다중 문서 요약(Multi-Document Summarization)을 위한

LLM과 지식 그래프를 결합하여 다중 문서 요약(MDS) 성능을 높이는 새로운 Mixture-of-Agents 프레임워크를 제안합니다. 별도의 미세 조정 없이 추출, 추상화, 정제 과정을 에이전트 단위로 수행하여 문서 간 복잡한 관계를 효과적으로 포착합니다.

6월 3일1
arXiv논문

인코더 축적을 넘어: 멀티 인코더 VLM에서 인코더의 역할 측정

멀티 인코더 시각-언어 모델(LVLM)에서 각 인코더의 역할과 상호작용을 분석한 연구입니다. Cambrian-1 스위트를 통해 인코더의 용량(Capacity)과 필요성(Necessity)을 정의하고, 최적의 인코더 조합을 찾는 방법론을 제시합니다.

6월 3일1
arXiv논문

합성 및 보상 — 실시간 환경에서의 다단계 도구 사용을 위한 강화학습 (Reinforcement Learning)

LLM의 다단계 도구 호출 능력을 향상시키기 위한 강화학습 프레임워크 PROVE를 제안합니다. MCP 서버 라이브러리, 자동화된 데이터 합성 파이프라인, 그리고 외부 모델 없이 작동하는 프로그래밍 방식 보상 체계를 통해 모델의 도구 사용 성능을 크게 개선했습니다.

6월 3일1
arXiv논문

Agent libOS: 장기 실행 및 권한 제어형 LLM 에이전트를 위한 Library-OS 기반 런타임

LLM 에이전트를 장기 실행 가능한 소프트웨어 액터로 진화시키기 위한 Library-OS 기반 런타임인 Agent libOS를 제안합니다. 에이전트를 프로세스 단위로 관리하며 권한 제어, 상태 유지, 감사 기록 및 인간의 승인 과정을 체계적으로 처리하는 구조를 다룹니다.

6월 3일1
arXiv논문

대규모 언어 모델(LLM)의 추론 구조

LRM의 성능을 단순히 정확도나 토큰 수로 평가하는 한계를 극복하기 위해, 추론 과정을 검증 가능한 추론 그래프로 변환하는 새로운 방법론을 제안합니다. 이를 통해 추론의 위상과 효율성을 정량적으로 분석하고 모델의 실패 모드를 진단할 수 있습니다.

6월 3일1
arXiv논문

에이전트형 AI 코딩 도구의 설정이 Build-vs-Buy 결정에 미치는 영향: 연구 프로토콜

에이전트형 AI 코딩 도구가 라이브러리 사용(Buy)과 직접 구현(Build) 사이에서 내리는 결정에 영향을 미치는 설정 메커니즘을 연구하는 프로토콜을 제시합니다. Claude Code와 OpenAI Codex를 대상으로 다양한 설정 환경에서 도구의 동작 변화를 실험하고 벤치마크 데이터셋을 공개할 예정입니다.

6월 3일0
arXiv논문

scTranslation: 단일 세포 멀티오믹스 모달리티 변환을 위한 종합적인 벤치마크

단일 세포 멀티오믹스 모달리티 변환을 위한 종합적인 벤치마크인 scTranslation을 제안합니다. 다양한 데이터셋, 최신 모델, 포괄적인 평가 지표를 포함하며 특징 선택 및 퓨샷 설정 등 다양한 시나리오에서의 성능을 체계적으로 분석합니다.

6월 3일0
arXiv논문

NetKV: 분리형 LLM 추론을 위한 네트워크 인지 디코드 인스턴스 선택 방식

분리형 LLM 추론 환경에서 네트워크 지연을 고려하여 디코드 인스턴스를 선택하는 NetKV 알고리즘을 제안합니다. 기존 스케줄러가 간과하던 토폴로지 거리와 네트워크 혼잡을 반영하여 TTFT를 획기적으로 단축합니다.

6월 3일0
arXiv논문

Hedge-Bench: 금융 추론과 관련된 어렵고 현실적인 과제에 대한 에이전트 벤치마킹

금융 분석가의 개방형 추론 능력을 평가하기 위한 새로운 벤치마크인 Hedge-Bench 1.0을 소개합니다. 실제 헤지펀드 분석가의 추론 과정을 기반으로 설계되어 기존 벤치마크의 한계를 극복하며, 최신 모델들도 매우 낮은 성능을 보였습니다.

6월 3일0
arXiv논문

q0: Hyper-Epoch 사전 학습을 위한 기본 요소들

멀티 에포크 학습의 효율성을 극대화하기 위해 단일 모델 대신 모델 집단의 예측을 집계하는 Hyper-Epoch(q0) 사전 학습 방식을 제안합니다. 순환 스케줄, 체인 증류, 학습된 사전 확률이라는 세 가지 요소를 통해 데이터 효율성을 획기적으로 높일 수 있습니다.

6월 3일0
arXiv논문

FFR: 회귀를 위한 Forward-Forward 학습

역전파(BP)를 대체할 수 있는 Forward-Forward 알고리즘을 회귀 문제로 확장한 FFR 프레임워크를 제안합니다. 거리 인식 순서형 지도 학습과 계층적 사다리 구조를 통해 연속적인 타겟 공간에서도 효율적인 학습이 가능함을 입증했습니다.

6월 3일0
arXiv논문

엔트로피만으로는 부족하다: 시각 기반 토큰 선택을 통한 시각적 추론을 위한 효과적인 강화학습 (Reinforcement Learning) 구현

시각적 추론을 위한 강화학습(RL)에서 기존의 토큰 엔트로피 기반 신용 할당 방식이 가진 한계를 지적합니다. 시각적 민감도를 엔트로피와 결합하여 성능을 높인 새로운 프레임워크 VEPO를 제안하며, 실험을 통해 기존 방식보다 높은 성능을 입증했습니다.

6월 3일0
arXiv논문

강화학습 (RL)에서 다양한 행동을 유도하기 위한 보상 불확실성 활용

강화학습에서 보상의 불확실성을 활용하여 에이전트의 행동 다양성을 유도하는 새로운 프레임워크를 제안합니다. 기존의 엔트로피 정규화 방식과 달리, 보상을 분포로 정의하여 성능 저하 없이 자연스러운 다양성을 확보합니다.

6월 3일0
arXiv논문

시각 조건부 UAV 내비게이션을 위한 자기 개선형 에이전트 강화학습 (Self-Refining Agentic Reinforcement

UAV 내비게이션을 위해 멀티모달 GPT 에이전트를 활용한 AgenticRL 프레임워크를 제안합니다. 이 시스템은 보상 함수 설계부터 정책 개선까지 폐쇄 루프 자기 개선 프로세스를 통해 자율적으로 수행하며, 시뮬레이션과 실제 환경 간의 높은 전이 성능을 입증했습니다.

6월 3일0
arXiv논문

FlashbackCL: 연합 학습(Federated Learning)에서의 시간적 망각 완화

연합 학습(FL) 환경에서 발생하는 시간적 데이터 분포 변화(temporal drift)로 인한 망각 문제를 해결하기 위한 FlashbackCL 방법론을 제안합니다. 시간적 감쇠 라벨 수와 CBRS 리플레이 버퍼 등을 통해 글로벌 모델이 과거 데이터에 고착되는 현상을 완화합니다.

6월 3일0
arXiv논문

발생하지 않은 대화를 활용한 효율적인 ASR 학습

저자원 언어 및 니치 도메인을 위한 대화형 ASR 학습을 위해 LLM과 TTS를 결합한 데이터 증강 파이프라인을 제안합니다. 합성된 시뮬레이션 대화가 실제 대화 데이터의 부족 문제를 효과적으로 보완하며 음성 인식 성능을 향상시킴을 입증했습니다.

6월 3일0
arXiv논문

상상적 지각 토큰(Imaginative Perception Tokens)을 통한 멀티모달 언어 모델의 공간 추론 능력 향상

시각 언어 모델(VLM)의 공간 추론 능력을 높이기 위해 상상적 지각 토큰(IPT)을 제안하는 연구입니다. IPT는 보이지 않는 공간을 추론하는 중간 지각 표현을 통해 관점 취하기, 경로 추적 등의 작업에서 성능을 향상시킵니다.

6월 3일0
arXiv논문

언어 모델에게도 수면이 필요하다: 자기 수정 및 기억 공고화를 학습하기

인간의 학습 과정을 모방하여 LLM의 지속적 학습과 지식 전이를 개선하는 '수면(Sleep)' 패러다임을 제안합니다. 기억 공고화와 꿈꾸기라는 두 단계를 통해 단기 지식을 장기 파라미터로 증류하고 스스로를 재귀적으로 개선합니다.

6월 3일0
arXiv논문

결합 문제 (Binding Problem)의 공식화

본 연구는 시각적 특징들이 하나의 객체로 연결되는 '결합 문제(Binding Problem)'를 정보 이론적 관점에서 공식화합니다. ViT 모델의 내부 표현에서 결합 정보를 측정하는 프로빙 방법을 제안하고, 다양한 시각적 과제를 통해 결합 능력이 시각적 인식과 추론의 핵심임을 입증합니다.

6월 3일0
arXiv논문

Humanoid-GPT: 제로샷 모션 트래킹을 위한 데이터 및 구조의 스케일링

Humanoid-GPT는 20억 프레임 규모의 대규모 모션 코퍼스로 학습된 GPT 스타일의 트랜스포머 모델입니다. 데이터와 모델 용량을 스케일링하여 기존 MLP 트래커의 한계를 극복하고, 미학습 동작 및 제어 태스크에 대해 뛰어난 제로샷 일반화 성능을 보여줍니다.

6월 3일0

이 피드 구독하기

본 페이지의 콘텐츠는 AI가 공개된 소스를 기반으로 자동 수집·요약·번역한 것입니다. 원 저작권은 각 원저작자에게 있으며, 각 게시물의 “원문 바로가기” 링크를 통해 원문을 확인할 수 있습니다. 저작권자의 삭제 요청이 있을 경우 신속히 조치합니다.