본문으로 건너뛰기

© 2026 Molayo

Insights

AI가 자동으로 큐레이션·번역·정리하는 기술 동향 피드입니다.

arXiv cs.AI 324필터 해제

arXiv논문

PhysNote: 진화 가능한 물리 추론을 위한 자기 지식 노트

PhysNote는 비전-언어 모델(VLMs)이 동적인 현실 시나리오에서 겪는 시간적 일관성 및 인과 추론의 한계를 극복하기 위해 설계된 에이전트 프레임워크입니다. 이 프레임워크는 물리 지식을 '지식 노트'라는 형태로 외부화하고 정제하는 메커니즘을 도입합니다. PhysNote는 공간-시간적 정규화를 통해 동적인 지각을 안정화시키고, 자기 생성 통찰력을 계층적 저장소에 조직하며, 반복적인 추론 루프를 거쳐 검증된 지식을 통합함으로써 물리 추론의 정확도를 크게 향상시킵니다.

vlmphysical-reasoningagent-framework
6일 전3
arXiv논문

XPU 를 통한 비전 - 언어 - 행동 (VLA) 모델 특성화: 온로봇 배포를 위한 제약 조건 및 가속화

본 논문은 범용 로봇 제어에 사용되는 VLA(Vision-Language-Action) 모델을 온로봇 환경에 배포할 때 발생하는 비용, 에너지, 시간적 제약을 다룹니다. 기존 연구가 데스크톱 GPU에 의존하여 엣지 가속기의 실제 성능을 제대로 평가하지 못했음을 지적하며, 모델과 하드웨어의 공동 특성화 분석을 통해 효율적인 저비용 엣지 디바이스를 제시합니다. 또한, VLM 백본과 액션 전문가 간의 추론 패턴 비효율성을 발견하고, DP-Cache 및 V-AEFusion이라는 새로운 최적화 기법을 제안하여 GPU와 NPU 환경 모두에서 높은 속도 향상을 달성했습니다.

vlaroboticsedge-ai
6일 전1
arXiv논문

SPLIT: 이미지 기반 촉각 센서를 위한 잠재적 산술을 통한 물리적 접촉 분리

본 논문은 로봇 촉각 센서 데이터 부족 문제를 해결하기 위해 이미지 기반 촉각 센서를 시뮬레이션하는 새로운 방법인 SPLIT을 제안합니다. SPLIT의 핵심은 접촉 기하학을 센서별 광학적 특성으로부터 분리하는 잠재 공간 산술 전략을 사용하는 것입니다. 이 접근 방식은 다양한 센서(DIGIT 배경)에 대한 재교정 없이 데이터 전이가 가능하며, 빠른 추론 속도와 가변 해상도의 유한 요소법 시뮬레이션을 제공하여 로봇 촉각 감지 연구의 효율성을 크게 높입니다.

robotic-tactile-sensingsimulationimage-based-sensors
6일 전1
arXiv논문

Generative Recommendation 을 위한 행동 강도 및 전이 모델링

본 논문은 다양한 상호작용 유형을 모델링하여 사용자의 전환을 예측하는 다중 행동 추천 시스템의 한계를 개선하기 위해 제안된 'BITRec'이라는 새로운 생성적 프레임워크를 소개합니다. 기존 방법들이 행동 강도 차이나 전이 패턴 포착에 실패했던 문제를 해결하고자, BITRec은 계층적 행동 집계(HBA)와 명시적인 관계 행렬을 이용한 전이 관계 인코딩(TRE)을 도입했습니다. 대규모 데이터셋 실험 결과, 여러 주요 추천 지표에서 15~23%의 높은 성능 향상을 입증하며 그 효과를 보여주었습니다.

recommendation-systemsmulti-behaviorgenerative-modeling
6일 전2
arXiv논문

인간-AI 팀워크에서의 성공적인 협력 측정: 인지된 협력성 및 팀워크 인식 척도의 개발과 검증

본 논문은 인간과 AI의 협력이 증가함에 따라, 그 주관적인 품질을 측정할 수 있는 두 가지 이론 기반 척도(PCS 및 TPS)를 개발하고 검증했습니다. PCS는 단일 상호작용에서의 인지된 협력 능력을 포착하며, TPS는 장기적이고 발생적인 팀워크의 느낌을 측정합니다. 이 척도들은 카드 게임, LLM 상호작용 등 다양한 환경에서 높은 신뢰성과 타당성을 보여주었으며, 향후 인간-AI 시스템 평가에 중요한 기초 자료를 제공할 것으로 기대됩니다.

human-ai-collaborationmeasuring-cooperationllm-interaction
6일 전2
arXiv논문

GAMMAF: LLM 다중 에이전트 시스템의 그래프 기반 이상 탐지 벤치마킹을 위한 공통 프레임워크

본 기술 기사는 LLM 다중 에이전트 시스템(MAS)의 취약점을 탐지하기 위한 표준화된 벤치마킹 프레임워크인 GAMMAF를 소개합니다. MAS는 협업 능력을 높였지만, 프롬프트 감염 등 새로운 공격 표면을 노출시켰습니다. GAMMAF는 합성 데이터셋 생성과 실시간 방어 모델 평가라는 두 가지 파이프라인을 통해 다양한 네트워크 토폴로지에서 에이전트 상호작용 데이터를 포착하고, 이를 활용하여 기존 및 미래의 이상 탐지 방어 메커니즘 성능을 체계적으로 벤치마킹할 수 있게 합니다.

llmmulti-agent-systemanomaly-detection
6일 전1
arXiv논문

배치 정렬형 저정밀도 신경망 구조 탐색을 위한 우주 탑재 엣지 AI

본 논문은 엣지 AI 환경에서 발생하는 구조-정밀도 불일치 문제를 해결하기 위한 새로운 접근 방식을 제시합니다. 기존의 하드웨어 인식 신경망 구조 탐색(NAS) 방법들은 정밀도를 전제로 최적화한 후 저정밀도를 나중에 적용하여, 실제 배치 실행 시 정확도가 크게 떨어지는 문제가 있었습니다. 연구진은 이 한계를 극복하고자 '배치 정렬형 저정밀도 학습'을 NAS 파이프라인에 직접 통합했습니다. 제안된 프레임워크는 후보 구조를 탐색하는 과정(미세 조정 및 평가)에서부터 FP16과 같은 낮은 정밀도의 수치적 제약을 노출시켜, 구조적 효율성과 저정밀도 하에서의 견고성을 동시에 최적화합니다. 우주 탑재 해상 모니터링 태스크에 적용한 결과, 기존 방식 대비 정확도 손실을 크게 줄여 모델 복잡도를 증가시키지 않으면서 높은 성능을 유지할 수 있음을 입증했습니다.

edge-ainaslow-precision
6일 전3
arXiv논문

왜 AI 피해는 한 번의 정체성으로는 해결될 수 없는가: 5,300 건의 사고 보고서가 교차성 (Intersectionality) 에 대해 드러낸 것

본 기사는 기존 AI 위험 평가 방법론이 개별 정체성 범주를 중심으로 구축되어 있어, 실제 발생하는 교차적 피해(intersectional harms)를 제대로 포착하지 못하고 있음을 지적한다. 5,300건의 AI 사고 보고서를 분석한 결과, AI로 인한 피해는 단일 정체성 범주에서 발생하기보다 여러 정체성 범주가 교차하는 지점에서 훨씬 더 심각하게 증폭되는 것으로 나타났다. 따라서 향후 AI 위험 평가는 인종과 성별 같은 개별 범주를 넘어, 다양한 정체성 간의 상호작용(교차성)을 핵심 구성 요소로 포함해야 한다고 주장한다.

ai-ethicsrisk-assessmentintersectionality
6일 전1
arXiv논문

내감각 기반 기계 프레임워크: 인공지능 내의 규제 구조를 위한 내감각 영감을 받은 접근

본 글은 생물학적 개념인 내감각(interoception)에서 영감을 받아 '내감각 기반 기계 프레임워크'를 제안합니다. 이 프레임워크는 내부 상태 모니터링, 통합 및 규제 원리를 계산 구조로 변환하여 AI 시스템의 자율성과 적응성을 높이는 것을 목표로 합니다. 핵심적으로 항상성, 알로스타시스, 에나틱이라는 세 가지 기능적 원리를 통해 AI가 불확실한 환경에서도 견고하게 자기 규제하고 능동적으로 상호작용할 수 있도록 설계하는 방법을 제시합니다.

interoceptionembodied-aiself-regulation
6일 전2
arXiv논문

STELLAR-E: 맞춤형 엔드투엔드 LLM 애플리케이션 엄밀한 평가자를 위한 합성 데이터 시스템

본 논문은 사생활 보호 및 비용 문제로 인해 기존 데이터셋 확보가 어려운 상황에서, 사용자 지정 크기의 고품질 합성 데이터셋을 생성할 수 있는 전자동 시스템 STELLAR-E를 제안합니다. 이 시스템은 TGRT Self-Instruct 프레임워크 기반의 합성 데이터 엔진과 통계적/LLM 기반 평가 파이프라인으로 구성되어 있습니다. STELLAR-E는 기존 벤치마킹 대비 높은 성능 향상을 보여주며, 대형 및 소형 LLM을 포괄적으로 평가할 수 있는 확장 가능하고 공정한 자동화 품질 보증 프레임워크를 제공합니다.

llmsynthetic-databenchmarking
6일 전4
arXiv논문

GradMAP: 그리드-에지 유연성을 위한 기반 강화학습 다중 에이전트 근접 학습

GradMAP은 그리드 에지 환경의 대규모 기기 군집을 조정하기 위해 기반 강화학습 다중 에이전트 근접 학습(GradMAP)을 제안합니다. 이 방법은 각 에이전트에 독립적인 신경망 정책을 학습시키고, 온라인 의사결정 시 통신 없이 로컬 관측만 사용하면서도 3상 AC 배전망의 물리 법칙과 네트워크 제약 조건을 준수하도록 설계되었습니다. GradMAP은 원형-쌍대 학습 루프와 암묵적 미분을 사용하여 정확한 전력 흐름 모델을 통합하고, 근접 서브리거트를 통해 환경 그래디언트 재사용으로 높은 학습 효율성을 달성하여 복잡한 그리드 제어 문제를 효과적으로 해결합니다.

reinforcement-learningmulti-agent-systempower-systems
6일 전1
arXiv논문

계층적 행동 공간 (Hierarchical Behaviour Spaces)

본 논문은 기존 강화학습에서 옵션 보상 함수를 사용하는 방식의 한계를 극복하기 위해 '계층적 행동 공간(HBS)'이라는 새로운 프레임워크를 제안합니다. HBS는 컨트롤러가 단일 보상 함수 대신 여러 보상 함수의 선형 조합을 지정하게 함으로써, 기존보다 훨씬 표현력이 풍부한 정책 집합을 생성할 수 있습니다. NetHack 환경에서 테스트된 이 방법은 특히 장기 추론보다는 탐색 능력 향상을 통해 강력한 성능 개선을 입증했습니다.

reinforcement-learninghierarchical-rlbehavior-spaces
6일 전2
arXiv논문

보편적인 차트-코드 생성을 위한 정렬된 다중 뷰 스크립트

본 논문은 차트 이미지를 다양한 프로그래밍 언어(Python, R, LaTeX)의 실행 가능한 코드로 변환하는 '차트-코드 생성' 문제를 다룹니다. 기존 방법들이 파이썬에 국한되거나 감독 정보 활용에 미흡했던 한계를 극복하기 위해, 연구진은 정렬된 스크립트를 제공하고 176K개의 차트로 구성된 데이터셋 Chart2NCode를 소개합니다. 또한, LLaVA 기반 아키텍처에 언어 조건부 저랭크 서브스페이스 혼합을 추가한 효율적인 적응 모듈 CharLuMA를 제안하여, 여러 언어에서 일관되고 시각적으로 충실한 코드 생성을 달성했습니다.

chart-to-codemultimodal-generationllava
6일 전2
arXiv논문

LLM 기반 주의 기반 재순위화 (Attention-based Re-ranking) 를 위한 쿼리 라우팅 학습

최근 연구되는 LLM 기반 주의 기반 재순위화는 문서 관련성 추정에 효과적이지만, 기존 방식들은 모든 헤드를 집계하거나 정적인 하위 집합에 의존하여 최적의 성능을 내기 어렵습니다. 본 논문은 쿼리마다 가장 적합한 헤드 집합을 선택하는 'RouteHead'라는 경량 라우터를 제안합니다. 이 라우터는 각 쿼리를 최적의 헤드들로 매핑하고, 관련성 점수를 오직 선택된 헤드의 주의 신호만을 이용해 계산함으로써 성능 저하 문제를 해결합니다.

llmattention-mechanismre-ranking
6일 전3
arXiv논문

NeSyCat: 신경상징주의 ULLER 프레임워크에 대한 모나드 기반 범주론적 의미론

NeSyCat은 신경상징주의 시스템에서 지식 베이스를 통합적으로 사용할 수 있도록 하는 ULLER(LEarning and Reasoning 통합 언어) 프레임워크를 소개합니다. 이 프레임워크는 고전적, 퍼지, 확률적 등 다양한 의미론을 모나드 기반의 범주론적 구조로 통일하여 모델링함으로써, 새로운 의미론의 추가와 기존 의미론 간의 체계적인 변환을 가능하게 합니다. 특히 Giry 모나드를 확장하여 일반화된 양화를 논리 텐서 네트워크에 적용하는 방법을 제시하며, Python과 Haskell에서 구현 가능한 모듈식 접근 방식을 제공합니다.

neural-symboliccategory-theorymonad
6일 전1
arXiv논문

XGRAG: 지식 그래프 기반 검색 증강 생성 (KG-based Retrieval-Augmented Generation) 을 설명하기 위한 그래프 네이티브 프레임워크

XGRAG는 지식 그래프(KGs)를 활용하는 검색 증강 생성(GraphRAG) 시스템의 설명 가능성(XAI) 문제를 해결하기 위해 제안된 새로운 프레임워크입니다. 기존 RAG-Ex와 같은 방법론은 텍스트 기반 구조에만 초점을 맞춰 관계적 지식을 포함하는 GraphRAG의 추론 과정을 투명하게 설명하는 데 한계가 있었습니다. XGRAG는 그래프 기반 교란 전략을 사용하여 개별 그래프 구성 요소가 최종 답변에 기여하는 정도를 정량화함으로써, 인과적으로 근거한 설명을 생성하여 시스템의 신뢰성과 해석 가능성을 획기적으로 향상시킵니다.

ragknowledge-graphllm
6일 전1
arXiv논문

Meta-CoT: 이미지 편집의 정교함과 일반화 능력 향상

본 논문은 이미지 편집의 정교한 이해와 일반화 능력을 동시에 향상시키는 새로운 프레임워크인 Meta-CoT를 제안합니다. Meta-CoT는 단일 편집 작업을 '편집 작업', '타겟', '필요 이해 능력'이라는 세 가지 요소로 분해하는 패러다임을 사용하며, 이를 통해 모델의 작업 특이적 이해도를 높입니다. 또한, 이 프레임워크는 편집 작업을 다섯 가지 기본 메타 작업으로 추가 분해하여 소수의 훈련만으로도 다양한 미지의 편집 작업에 강력하게 일반화되는 능력을 입증했습니다.

image-editingchain-of-thoughtmultimodal-understanding
6일 전1
arXiv논문

K-MetBench: 기상학의 전문적 추론, 지역성, 그리고 다중모달리티에 대한 세밀한 평가를 위한 다차원 벤치마크

본 기사는 한국의 전문적인 기상학 분야에 특화된 대규모 언어 모델(LLM) 평가 벤치마크인 K-MetBench를 소개합니다. 이 벤치마크는 국가 자격시험을 기반으로 하며, 전문가 시각적 추론, 논리적 타당성, 한국의 지리/문화 이해, 그리고 세밀한 도메인 분석 등 네 가지 차원에서 모델 성능을 평가합니다. 연구 결과, 기존 글로벌 모델들은 전문적인 다이어그램 해석이나 지역적 맥락 이해에서 한계를 보였으며, 이는 단순한 파라미터 크기 확장만으로는 해결할 수 없는 문화적/도메인 의존성이 있음을 입증했습니다.

k-metbenchllm-evaluationdomain-adaptation
6일 전1
arXiv논문

DepthKV: 긴 컨텍스트 LLM 추론을 위한 레이어 의존적 KV 캐시 가지치기

DepthKV는 긴 컨텍스트 LLM 추론 시 발생하는 메모리 병목 현상을 해결하기 위해 제안된 새로운 KV 캐시 가지치기 프레임워크입니다. 기존 방법들이 모든 레이어에 동일한 가지치 비율을 적용하는 한계를 가졌던 반면, DepthKV는 각 레이어의 성능 기여도(민감도)를 고려하여 전체 KV 캐시 예산을 할당합니다. 이를 통해 메모리 효율성을 높이면서도 모델의 추론 성능 저하를 최소화할 수 있음을 여러 실험에서 입증했습니다.

llmkv-cachepruning
6일 전5
arXiv논문

AgentWard: 자율형 AI 에이전트를 위한 라이프사이클 보안 아키텍처

본 논문은 스킬 로딩, 메모리 유지, 다단계 행동 계획 등 복잡한 기능을 수행하는 자율형 AI 에이전트의 런타임 보안 문제를 다룹니다. 제시된 AgentWard는 초기화부터 입력 처리, 메모리, 의사결정, 실행에 이르는 다섯 가지 라이프사이클 단계를 체계적으로 보호하는 심층 방어 아키텍처입니다. 이는 단계별 이질적인 컨트롤과 교차 계층 조정을 통합하여 위협 전파 경로를 따라 보안 취약점을 차단하고 핵심 자산을 보호할 수 있는 구체적인 청사진을 제공합니다.

autonomous-agentsllm-securityruntime-security
6일 전1

이 피드 구독하기

본 페이지의 콘텐츠는 AI가 공개된 소스를 기반으로 자동 수집·요약·번역한 것입니다. 원 저작권은 각 원저작자에게 있으며, 각 게시물의 “원문 바로가기” 링크를 통해 원문을 확인할 수 있습니다. 저작권자의 삭제 요청이 있을 경우 신속히 조치합니다.