본문으로 건너뛰기

© 2026 Molayo

Insights

AI가 자동으로 큐레이션·번역·정리하는 기술 동향 피드입니다.

arXiv cs.AI 1976필터 해제

arXiv논문

강화학습 (Reinforcement Learning) 파운데이션 모델은 이미 존재해야 한다

구조화된 데이터인 강화학습(RL)을 위한 파운데이션 모델의 필요성과 방법론을 제시합니다. 합성 MDP를 활용한 사전 설계와 어텐션 기반 아키텍처를 통해, 별도의 튜닝 없이도 인컨텍스트 방식으로 정형 데이터 벤치마크를 해결할 수 있음을 증명합니다.

23시간 전0
arXiv논문

SwitchBraidNet: 하이브리드 뇌-컴퓨터 인터페이스를 위한 양자화 인식 경량 아키텍처

하이브리드 BCI를 위해 설계된 경량 EEG 분류 아키텍처인 SwitchBraidNet을 제안합니다. 양자화 인식 학습을 통해 저전력 임베디드 하드웨어에서도 높은 정확도와 효율성을 유지하며 동작합니다.

23시간 전0
arXiv논문

성숙하는 마르코프 결정 과정 (Maturing Markov Decision Processes): 증가하는 정보와 축소되는 행동 집합 하에서의

정보는 증가하고 실행 가능한 행동은 줄어드는 비대칭적 구조를 다루는 '성숙하는 마르코프 결정 과정(MMDPs)'을 제안합니다. 만료 행동 우선순위 원칙을 통해 의사결정 효율성을 높이는 구조 인식 강화학습 프레임워크를 소개합니다.

23시간 전0
arXiv논문

tSeTlin machine을 이용한 목표 신뢰도 기반 구제: TRUST

tSeTlin machine을 활용하여 사용자가 지정한 목표 신뢰도를 충족하는 알고리즘적 구제 프레임워크인 TRUST를 제안합니다. 기존의 경계 기반 방식과 달리, 결정의 강건성을 보장하기 위해 신뢰도를 직접 제어하며 최적의 반사실적 설명을 탐색합니다.

23시간 전0
arXiv논문

공간이 곧 지능이다: 리만 계량 (Riemannian Metric) 생성을 위한 신경 반군 중첩 (Neural Semigroup

지능을 에이전트 내부가 아닌 공간의 기하학적 구조에 배치하는 새로운 접근 방식을 제안합니다. 신경 반군 중첩 메커니즘을 통해 리만 계량을 생성하며, 이를 통해 복잡한 장면에서도 효율적인 경로 탐색과 강력한 제로샷 일반화 성능을 보여줍니다.

23시간 전0
arXiv논문

Skill-MAS: 자동화된 멀티 에이전트 시스템(Multi-Agent Systems)을 위한 진화하는 메타 스킬 (Meta-Skill)

Skill-MAS는 LLM 기반 멀티 에이전트 시스템(MAS)의 경험 유지 문제를 해결하기 위해 진화 가능한 '메타 스킬'을 제안합니다. 파라미터 업데이트 없이도 폐쇄형 최적화 루프를 통해 시스템적 경험을 전략적 원칙으로 증류하여 성능을 높입니다.

23시간 전0
arXiv논문

이전 협업의 에피소드 기억(Episodic Memory)을 통한 도시 수색 및 구조에서의 인간-로봇 팀워크 향상

로봇이 과거의 협업 패턴을 지식 그래프 형태의 에피소드 기억으로 저장하고 재사용하여 인간과의 팀워크를 향상시키는 연구를 소개합니다. 실험 결과, 이전 경험을 활용한 로봇 초기화가 구조 성공률을 높이고 작업 시간을 단축함을 입증했습니다.

23시간 전0
arXiv논문

WorldLines: 장기적 상태 유지 임바디드 에이전트 (Embodied Agents)를 위한 벤치마킹 및 모델링

장기적 가사 보조를 위해 사용자의 루틴과 환경 변화를 기억해야 하는 임바디드 에이전트를 위한 새로운 벤치마크 WorldLines를 소개합니다. 동적 환경에서의 장기 기억 활용을 평가하기 위해 시간적 데이터셋을 구축하고, 이를 위한 새로운 기억 프레임워크인 ObsMem을 제안합니다.

23시간 전0
arXiv논문

미분 가능한 관절 추론 및 에너지 일관성 검증을 통한 RGB-D 시퀀스로부터의 URDF 합성

KinemaForge는 RGB-D 시퀀스를 활용해 관절이 있는 객체의 형상, 토폴로지, 파라미터를 동시에 추론하는 새로운 파이프라인을 제안합니다. 미분 가능한 강체 역학을 통해 에너지 일관성을 검증함으로써 물리 시뮬레이션 시 발생하는 드리프트 문제를 획기적으로 개선했습니다.

23시간 전0
arXiv논문

대규모 미라벨링 데이터를 활용한 학습 기반 AEB의 스케일링

대규모 미라벨링 데이터를 활용하여 자동 비상 제동(AEB) 시스템을 스케일링하는 MF-SSL 프레임워크를 제안합니다. 노이즈 인지 디커플링과 운동학적 게이트 기술을 통해 의사 라벨 오류를 억제하고 안전성을 높였습니다. 1B 규모의 데이터 학습을 통해 사고 없는 주행 마일리지를 35% 향상시키는 성과를 거두었습니다.

23시간 전0
arXiv논문

리서치 하네스(Research Harness)를 통한 AI 과학자의 연구 합성 및 검증 외부화

AI 과학자의 연구 과정을 자동화할 때 발생하는 추론의 불투명성을 해결하기 위해 'Xcientist'라는 리서치 하네스를 제안합니다. 이는 연구의 증거, 아이디어, 실험 과정을 외부화된 아티팩트로 관리하여 연구의 검사 가능성과 책임성을 확보합니다.

23시간 전0
arXiv논문

회전 시스템의 불균형 특성화를 위한 도메인 이동 인지 신경망 (Domain-Shift Aware Neural Networks)

회전 시스템의 불균형 질량 추정을 위해 도메인 이동을 인지하는 신경망 연구를 소개합니다. MMD 전략을 활용해 소스 및 타겟 분포 간의 특징을 정렬함으로써, 운전 조건 변화에도 높은 예측 정확도를 유지합니다.

23시간 전0
arXiv논문

부분 관측 가능 환경에서의 내비게이션을 위한 생성 모델 기반 예측 계획 (Generative-Model Predictive Planning)

부분 관측 가능 환경에서 자율 에이전트의 내비게이션 성능을 높이기 위한 새로운 프레임워크 BeliefDiffusion을 제안합니다. 확산 모델을 통해 다중 모드 신념 분포를 포착하고 모델 예측 제어(MPC)를 결합하여 효율적인 경로 계획을 수행합니다.

23시간 전0
arXiv논문

GUI 에이전트를 위한 기술 가이드 기반 연속 증류 (Skill-Guided Continuation Distillation)

GUI 에이전트의 오프-궤적 상태 문제를 해결하기 위해 기술 가이드 기반 연속 증류(SGCD) 프레임워크를 제안합니다. SGCD는 전문가 궤적을 벗어난 상태에서도 성공적인 연속 실행을 생성하여 정책의 감독 격차를 해소합니다. OSWorld-Verified 벤치마크에서 모델의 성공률을 30%대에서 50% 이상으로 크게 향상시켰습니다.

23시간 전0
arXiv논문

SAERec: Sparse Autoencoder를 통한 추천을 위한 세밀하고 해석 가능한 의도 사전 구축

SAERec는 Sparse Autoencoder(SAE)를 활용하여 LLM의 잠재 공간에서 세밀하고 해석 가능한 의도 사전(intent priors)을 구축하는 새로운 추천 모델입니다. 텍스트 임베딩을 얽힘 해제하여 개인적·공통 의도를 추출하고, 멀티 브랜치 어텐션 메커니즘을 통해 추천의 정확도와 해석 가능성을 동시에 높였습니다.

23시간 전0
arXiv논문

TransitNet: 낮은 SNR의 트랜싯 블라인드 탐색을 위한 컴팩트한 어텐션 증강 딥러닝 프레임워크

낮은 신호 대 잡음비(low-SNR) 환경에서 지구 크기 행성을 탐색하기 위한 어텐션 증강 딥러닝 프레임워크 TransitNet을 제안합니다. 기존 TLS 및 BLS 알고리즘보다 높은 정확도와 회복률을 보이며, 매우 컴팩트한 모델 크기로 높은 추론 효율성을 제공합니다.

23시간 전0
arXiv논문

RTSGameBench: 시각-언어 모델(VLMs)의 전략적 추론을 위한 RTS 벤치마크

시각-언어 모델(VLMs)의 전략적 추론 능력을 평가하기 위한 새로운 RTS 벤치마크인 RTSGameBench를 제안합니다. Beyond All Reason 게임을 기반으로 다양한 매치업과 자기 진화형 생성 프레임워크를 통해 모델의 한계를 체계적으로 진단합니다.

23시간 전0
arXiv논문

SciRisk-Bench: AI4Science 안전성을 위한 위험 차원 인식 벤치마크

AI4Science 워크플로우의 안전성을 평가하기 위해 설계된 새로운 벤치마크인 SciRisk-Bench를 소개합니다. 이 벤치마크는 7개 학문 분야와 10개의 위험 차원을 통해 LLM의 과학적 위험 인식 능력을 정밀하게 진단합니다.

23시간 전0
arXiv논문

뇌 MRI를 위한 양자 잠재 GAN 증강(Quantum-Latent GAN Augmentation)의 통제된 벤치마크

뇌 MRI 증강을 위한 양자 잠재 GAN의 효용성을 검증하기 위해 파라미터 수를 통제한 벤치마크를 제시합니다. 실험 결과, 양자 생성기는 고전적 생성기와 통계적으로 차이가 없었으며, 데이터 부족 상황에서 유의미한 성능 향상을 보이지 못했습니다.

23시간 전0
arXiv논문

ThinkDeception: 해석 가능한 멀티모달 기만 탐지를 위한 점진적 강화학습 프레임워크

ThinkDeception은 해석 가능한 멀티모달 기만 탐지를 위한 새로운 프레임워크를 제안합니다. MLLM과 점진적 강화학습(VAC-GRPO)을 활용하여 모달 간 불일치를 포착하고, 단계별 사고의 사슬(CoT)을 통해 투명한 추론 과정을 제공합니다.

23시간 전0

이 피드 구독하기

본 페이지의 콘텐츠는 AI가 공개된 소스를 기반으로 자동 수집·요약·번역한 것입니다. 원 저작권은 각 원저작자에게 있으며, 각 게시물의 “원문 바로가기” 링크를 통해 원문을 확인할 수 있습니다. 저작권자의 삭제 요청이 있을 경우 신속히 조치합니다.