본문으로 건너뛰기

© 2026 Molayo

Insights

AI가 자동으로 큐레이션·번역·정리하는 기술 동향 피드입니다.

arXiv cs.AI 2012필터 해제

arXiv논문

공간이 곧 지능이다: 리만 계량 (Riemannian Metric) 생성을 위한 신경 반군 중첩 (Neural Semigroup

지능을 에이전트 내부가 아닌 공간의 기하학적 구조에 배치하는 새로운 접근 방식을 제안합니다. 신경 반군 중첩 메커니즘을 통해 리만 계량을 생성하며, 이를 통해 복잡한 장면에서도 효율적인 경로 탐색과 강력한 제로샷 일반화 성능을 보여줍니다.

1일 전0
arXiv논문

Skill-MAS: 자동화된 멀티 에이전트 시스템(Multi-Agent Systems)을 위한 진화하는 메타 스킬 (Meta-Skill)

Skill-MAS는 LLM 기반 멀티 에이전트 시스템(MAS)의 경험 유지 문제를 해결하기 위해 진화 가능한 '메타 스킬'을 제안합니다. 파라미터 업데이트 없이도 폐쇄형 최적화 루프를 통해 시스템적 경험을 전략적 원칙으로 증류하여 성능을 높입니다.

1일 전0
arXiv논문

이전 협업의 에피소드 기억(Episodic Memory)을 통한 도시 수색 및 구조에서의 인간-로봇 팀워크 향상

로봇이 과거의 협업 패턴을 지식 그래프 형태의 에피소드 기억으로 저장하고 재사용하여 인간과의 팀워크를 향상시키는 연구를 소개합니다. 실험 결과, 이전 경험을 활용한 로봇 초기화가 구조 성공률을 높이고 작업 시간을 단축함을 입증했습니다.

1일 전0
arXiv논문

WorldLines: 장기적 상태 유지 임바디드 에이전트 (Embodied Agents)를 위한 벤치마킹 및 모델링

장기적 가사 보조를 위해 사용자의 루틴과 환경 변화를 기억해야 하는 임바디드 에이전트를 위한 새로운 벤치마크 WorldLines를 소개합니다. 동적 환경에서의 장기 기억 활용을 평가하기 위해 시간적 데이터셋을 구축하고, 이를 위한 새로운 기억 프레임워크인 ObsMem을 제안합니다.

1일 전0
arXiv논문

미분 가능한 관절 추론 및 에너지 일관성 검증을 통한 RGB-D 시퀀스로부터의 URDF 합성

KinemaForge는 RGB-D 시퀀스를 활용해 관절이 있는 객체의 형상, 토폴로지, 파라미터를 동시에 추론하는 새로운 파이프라인을 제안합니다. 미분 가능한 강체 역학을 통해 에너지 일관성을 검증함으로써 물리 시뮬레이션 시 발생하는 드리프트 문제를 획기적으로 개선했습니다.

1일 전0
arXiv논문

대규모 미라벨링 데이터를 활용한 학습 기반 AEB의 스케일링

대규모 미라벨링 데이터를 활용하여 자동 비상 제동(AEB) 시스템을 스케일링하는 MF-SSL 프레임워크를 제안합니다. 노이즈 인지 디커플링과 운동학적 게이트 기술을 통해 의사 라벨 오류를 억제하고 안전성을 높였습니다. 1B 규모의 데이터 학습을 통해 사고 없는 주행 마일리지를 35% 향상시키는 성과를 거두었습니다.

1일 전0
arXiv논문

리서치 하네스(Research Harness)를 통한 AI 과학자의 연구 합성 및 검증 외부화

AI 과학자의 연구 과정을 자동화할 때 발생하는 추론의 불투명성을 해결하기 위해 'Xcientist'라는 리서치 하네스를 제안합니다. 이는 연구의 증거, 아이디어, 실험 과정을 외부화된 아티팩트로 관리하여 연구의 검사 가능성과 책임성을 확보합니다.

1일 전0
arXiv논문

회전 시스템의 불균형 특성화를 위한 도메인 이동 인지 신경망 (Domain-Shift Aware Neural Networks)

회전 시스템의 불균형 질량 추정을 위해 도메인 이동을 인지하는 신경망 연구를 소개합니다. MMD 전략을 활용해 소스 및 타겟 분포 간의 특징을 정렬함으로써, 운전 조건 변화에도 높은 예측 정확도를 유지합니다.

1일 전0
arXiv논문

부분 관측 가능 환경에서의 내비게이션을 위한 생성 모델 기반 예측 계획 (Generative-Model Predictive Planning)

부분 관측 가능 환경에서 자율 에이전트의 내비게이션 성능을 높이기 위한 새로운 프레임워크 BeliefDiffusion을 제안합니다. 확산 모델을 통해 다중 모드 신념 분포를 포착하고 모델 예측 제어(MPC)를 결합하여 효율적인 경로 계획을 수행합니다.

1일 전0
arXiv논문

GUI 에이전트를 위한 기술 가이드 기반 연속 증류 (Skill-Guided Continuation Distillation)

GUI 에이전트의 오프-궤적 상태 문제를 해결하기 위해 기술 가이드 기반 연속 증류(SGCD) 프레임워크를 제안합니다. SGCD는 전문가 궤적을 벗어난 상태에서도 성공적인 연속 실행을 생성하여 정책의 감독 격차를 해소합니다. OSWorld-Verified 벤치마크에서 모델의 성공률을 30%대에서 50% 이상으로 크게 향상시켰습니다.

1일 전0
arXiv논문

SAERec: Sparse Autoencoder를 통한 추천을 위한 세밀하고 해석 가능한 의도 사전 구축

SAERec는 Sparse Autoencoder(SAE)를 활용하여 LLM의 잠재 공간에서 세밀하고 해석 가능한 의도 사전(intent priors)을 구축하는 새로운 추천 모델입니다. 텍스트 임베딩을 얽힘 해제하여 개인적·공통 의도를 추출하고, 멀티 브랜치 어텐션 메커니즘을 통해 추천의 정확도와 해석 가능성을 동시에 높였습니다.

1일 전0
arXiv논문

TransitNet: 낮은 SNR의 트랜싯 블라인드 탐색을 위한 컴팩트한 어텐션 증강 딥러닝 프레임워크

낮은 신호 대 잡음비(low-SNR) 환경에서 지구 크기 행성을 탐색하기 위한 어텐션 증강 딥러닝 프레임워크 TransitNet을 제안합니다. 기존 TLS 및 BLS 알고리즘보다 높은 정확도와 회복률을 보이며, 매우 컴팩트한 모델 크기로 높은 추론 효율성을 제공합니다.

1일 전0
arXiv논문

RTSGameBench: 시각-언어 모델(VLMs)의 전략적 추론을 위한 RTS 벤치마크

시각-언어 모델(VLMs)의 전략적 추론 능력을 평가하기 위한 새로운 RTS 벤치마크인 RTSGameBench를 제안합니다. Beyond All Reason 게임을 기반으로 다양한 매치업과 자기 진화형 생성 프레임워크를 통해 모델의 한계를 체계적으로 진단합니다.

1일 전0
arXiv논문

SciRisk-Bench: AI4Science 안전성을 위한 위험 차원 인식 벤치마크

AI4Science 워크플로우의 안전성을 평가하기 위해 설계된 새로운 벤치마크인 SciRisk-Bench를 소개합니다. 이 벤치마크는 7개 학문 분야와 10개의 위험 차원을 통해 LLM의 과학적 위험 인식 능력을 정밀하게 진단합니다.

1일 전0
arXiv논문

뇌 MRI를 위한 양자 잠재 GAN 증강(Quantum-Latent GAN Augmentation)의 통제된 벤치마크

뇌 MRI 증강을 위한 양자 잠재 GAN의 효용성을 검증하기 위해 파라미터 수를 통제한 벤치마크를 제시합니다. 실험 결과, 양자 생성기는 고전적 생성기와 통계적으로 차이가 없었으며, 데이터 부족 상황에서 유의미한 성능 향상을 보이지 못했습니다.

1일 전0
arXiv논문

ThinkDeception: 해석 가능한 멀티모달 기만 탐지를 위한 점진적 강화학습 프레임워크

ThinkDeception은 해석 가능한 멀티모달 기만 탐지를 위한 새로운 프레임워크를 제안합니다. MLLM과 점진적 강화학습(VAC-GRPO)을 활용하여 모달 간 불일치를 포착하고, 단계별 사고의 사슬(CoT)을 통해 투명한 추론 과정을 제공합니다.

1일 전0
arXiv논문

TRAP: 작업 완료 능력 및 능동적 개인정보 추출 저항성 벤치마크

에이전트의 작업 수행 능력과 개인정보 보호 사이의 트레이드오프를 평가하는 새로운 벤치마크인 TRAP을 소개합니다. 연구 결과, 기존의 프롬프트 기반 방어는 작업 정확도를 저하시키며 소프트맥스 기반 모델에서는 두 목표를 동시에 달성하기 어렵다는 불가능성 결과를 입증했습니다.

1일 전0
arXiv논문

Spotlight: DiT RL 사후 학습을 위한 시드 탐색(Seed Exploration)과 스팟 GPU(Spot GPUs)의 시너지 활용

DiT RL 사후 학습의 비용 문제를 해결하기 위해 스팟 GPU와 시드 탐색을 결합한 시스템 Spotlight를 제안합니다. 오래된 가중치를 활용한 탐색과 탄력적 시퀀스 병렬성(SP) 재구성을 통해 학습 효율을 극대화합니다.

1일 전0
arXiv논문

FoMoE: MoE 연합을 통한 풀-레플리카(Full-Replica) 장벽 돌파

FoMoE는 MoE 아키텍처 학습 시 모든 사이트에 모델 전체 복제본이 필요했던 기존 방식의 메모리 및 통신 한계를 극복하는 연구입니다. 전문가 레이어를 워커 간에 분할하여 통신 비용을 획기적으로 줄이고 처리량을 향상시킵니다.

1일 전0
arXiv논문

HRRR 예측 오차 예측을 위한 하이브리드 LSTM-Vision Transformer 아키텍처

HRRR 수치 예보 모델의 오차를 예측하기 위해 LSTM과 Vision Transformer를 결합한 하이브리드 LSTM-ViT 아키텍처를 제안합니다. 대기 프로파일의 수직 구조 정보를 통합하여 기존 LSTM 대비 강수량 예측 오차 성능을 약 2배 향상시켰습니다.

1일 전0

이 피드 구독하기

본 페이지의 콘텐츠는 AI가 공개된 소스를 기반으로 자동 수집·요약·번역한 것입니다. 원 저작권은 각 원저작자에게 있으며, 각 게시물의 “원문 바로가기” 링크를 통해 원문을 확인할 수 있습니다. 저작권자의 삭제 요청이 있을 경우 신속히 조치합니다.