본문으로 건너뛰기

© 2026 Molayo

Insights

AI가 자동으로 큐레이션·번역·정리하는 기술 동향 피드입니다.

arXiv cs.AI 323필터 해제

arXiv논문

본질적 자격: 고급 에너지 및 전자 소재 배포를 위한 자율적 프레임워크

본 기술 기사는 고급 에너지 및 전자 소재를 발견하고 개발하는 과정에 있어, 초기 유망한 시스템이 실제 상용화 단계(배포)에 도달하지 못하는 '사막의 죽음' 문제를 다룹니다. 이를 해결하기 위해, 실험실 수준의 지표뿐만 아니라 산업적 생존 가능성을 최우선으로 고려하는 새로운 자율 과학 프레임워크를 제안합니다.

autonomous-scienceenergy-materialselectronicsmaterial-discoverycommercialization
5시간 전5
arXiv논문

지향적 사회적 존경: 온라인 미디어의 타겟팅된 선전, 반대, 지원, 피해 및 착취 표면화

본 논문은 온라인 미디어에서 발생하는 복잡한 감정적 메시지를 분석하기 위해 '지향적 사회적 존경(Directed Social Regard, DSR)'이라는 새로운 다차원적 감정 분석 접근법을 제안합니다. 기존 NLP 도구들이 텍스트의 전반적인 감정만 포착하는 한계를 극복하고, DSR은 메시지의 특정 구절(span) 단위로 '존경'이라는 개념을 세 가지 축(-1, 1)을 따라 점수화하여, 친사회적/반사회적 감정과 그 대상(target)을 동시에 식별할 수 있습니다. 이 접근법은 트랜스포머 기반 모델 쌍으로 구성되며, 실제 온라인 미디어 데이터셋에 적용하여 유의미한 결과를 입증했습니다.

nlpsentiment-analysisemotion-detection
5시간 전2
arXiv논문

"당신은 실제로 무엇을 이루려 하고 있나요?": 일상 컴퓨터 사용에서 삶의 목표를 공동 창작하다

본 기술 기사는 사용자의 일상적인 컴퓨터 사용 패턴으로부터 그들의 근본적인 삶의 목표를 추론하는 새로운 '스트라이빙 공동 창작(striving co-creation)' 과정을 소개합니다. 이 시스템은 활동 이론과 개인적 스트라이빙 프레임워크에 기반하여, 단순한 행동 관찰을 넘어 사용자 활동의 계층적 구조와 그 목적까지 파악하려고 시도합니다. 특히, 사용자가 시스템이 자신을 이해하는 방식에 개입하고 수정할 수 있는 편집 인터페이스를 제공함으로써, 주도권을 부여하고 더 정확하며 개인화된 목표 추론을 가능하게 합니다.

user-modelingactivity-theorygoal-inference
7시간 전2
arXiv논문

물리적으로 본 세계 모델: 생성적 세계 모델링의 해밀토니안 관점

본 논문은 세계 모델(World Models) 연구가 시각적 합성, 3D 재구성, 잠재 표현 등 여러 부분으로 분산되어 있어 물리적으로 신뢰할 수 있는 예측에 한계가 있음을 지적하며, 이를 해결하기 위해 해밀토니안 세계 모델(Hamiltonian World Models)을 제안합니다. 이 모델은 관찰을 구조화된 잠재 위상 공간에 인코딩하고, 제어, 감쇠, 잔류항이 포함된 해밀토니안 역학을 통해 상태를 진화시키며 예측 궤적을 생성하여 계획에 활용하는 물리 기반 접근 방식입니다. 이러한 해밀토니안 구조는 모델의 해석 가능성, 데이터 효율성, 그리고 장기적인 안정성을 크게 개선할 수 있습니다.

world-modelshamiltonian-dynamicsrobotics
7시간 전2
arXiv논문

트리에서 플로우와 백: 계층적 의사결정 트리와 확산 모델의 통합

본 연구는 이산적이고 계층적인 의사결정 트리와 연속적이고 동적인 확산 모델을 수학적으로 통합하는 새로운 프레임워크를 제시합니다. 두 모델 간의 날카로운 대응 관계를 설정하고 공통 최적화 원리인 Global Trajectory Score Matching (GTSM)을 도출함으로써, 이상화된 그래디언트 부스팅이 점근적으로 최적임을 입증했습니다. 이를 통해 높은 정밀도와 속도를 갖춘 새로운 생성 모델(reeflow)과 계층적 의사결정 논리를 신경망으로 효과적으로 전이하는 방법(dsmtree)을 개발했습니다.

diffusion-modelsdecision-treesgenerative-ai
7시간 전3
arXiv논문

BWLA: LLMs의 W1AX 양자화 장벽 돌파

본 기술 기사는 대형 언어 모델(LLMs)의 메모리 및 컴퓨팅 요구사항 문제를 해결하기 위해 BWLA (Binarized Weights and Low-bit Activations)라는 새로운 양자화 프레임워크를 제안합니다. BWLA는 가중치를 1비트로 압축하는 동시에 활성화에 저비트 정밀도(예: 6비트)를 적용하여, 기존 방법들이 해결하지 못했던 활성화의 무거운 꼬리 문제를 극복하고 높은 정확도를 유지합니다. 이 프레임워크는 Qwen3-32B 모델에서 뛰어난 성능을 보여주었으며, 추론 속도 향상과 다양한 NLP 작업에서의 개선을 입증하며 LLM 경량화에 큰 잠재력을 제시합니다.

llmsquantizationbinarization
7시간 전2
arXiv논문

요구사항 인식이 있는 커리큘럼 강화학습을 통한 LLM 코드 생성 성능 개선

본 논문은 복잡해지는 프로그래밍 요구사항을 처리하는 LLM의 코드 생성 성능 한계를 극복하기 위해 RECRL이라는 새로운 프레임워크를 제안합니다. RECRL은 소프트웨어 요구사항 공학(Software Requirements Engineering)의 통찰력을 활용하여, 모델이 요구사항의 난이도를 자동으로 인식하고, 훈련 데이터의 효율성을 높이기 위해 도전적인 요구사항을 최적화하며, 적응형 샘플링 전략으로 점진적인 난이도의 학습 배치를 구축합니다. 광범위한 실험 결과, RECRL은 기존 최고 성능 대비 평균 Pass@1에서 상당한 성능 향상을 입증했습니다.

llmcode-generationreinforcement-learning
7시간 전2
arXiv논문

AEM: 다중 턴 에이전트 강화학습을 위한 적응형 엔트로피 변조

본 논문은 대형 언어 모델(LLM) 기반 에이전트가 다중 턴 작업을 수행할 때 발생하는 희소 보상 문제와 크레딧 할당 어려움을 해결하기 위한 새로운 방법인 AEM을 제안합니다. AEM은 강화 학습(RL) 훈련 과정 중 엔트로피 역학을 적응적으로 변조하여, 탐험과 활용 사이의 균형을 효과적으로 맞추는 감독 없는 크레딧 할당 방법을 제공합니다. 광범위한 실험 결과, 특히 SWE-bench-Verified와 같은 까다로운 벤치마크에서 기존 최신 모델 대비 유의미한 성능 향상을 입증했습니다.

reinforcement-learningllm-agentsentropy-modulation
7시간 전2
arXiv논문

신뢰할 수 있는 검증 가능한 아티팩트로서의 에이전트 스킬: 인간이 루프에 포함된 에이전트 런타임용 신뢰 스키마 및 쌍조건적 정확성 기준

본 논문은 에이전트 스킬(Agent skills)을 신뢰할 수 있는 검증 가능한 아티팩트로 간주하고, 이를 로드하는 런타임 환경에 대한 새로운 신뢰 프레임워크를 제안합니다. 핵심 주장은 스킬은 검증되기 전까지는 기본적으로 '신뢰할 수 없는 코드'로 취급되어야 하며, 기존의 서명이나 허가 기반 신뢰 추론 방식으로는 부족하다는 것입니다. 이를 위해 명시적인 검증 수준을 포함하는 신뢰 스키마와, 이 검증 수준에 따라 인간 개입(HITL) 정책이 동적으로 변화하는 '쌍조건적' 정확성 기준을 제시합니다.

agent-skillsllm-runtimetrust-schema
7시간 전2
arXiv논문

텍스트와 이미지를 활용한 사고: 장기 지평 로봇 조작을 위한 교차 시각-언어 추론 흔적

본 논문은 장기 지평 로봇 조작을 위해 명시적인 중간 표현인 '교차 시각-언어 추론 흔적(Interleaved Vision-Language Reasoning Trace)'을 활용하는 IVLR 프레임워크를 제안합니다. 이 프레임워크는 초기 관측과 지시사항에서 전역적인 의미-기하학적 단서를 생성하고, 이를 행동 디코더에 조건부로 제공하여 로봇의 계획 일관성을 높입니다. 시뮬레이션 벤치마크(LIBERO 등)에서 높은 성공률을 달성했으며, 특히 두 모달리티가 결합된 전역적인 흔적이 가장 효과적임을 입증했습니다.

roboticsvision-languagelong-horizon
7시간 전2
arXiv논문

LLM 생성의 모드 붕괴를 기하학적 규제를 통해 탈출하기

본 논문은 생성 모델링의 주요 문제인 모드 붕괴(mode collapse)를 동역학 시스템 관점에서 '기하학적 붕괴'로 재해석하고, 이를 해결하기 위한 새로운 접근 방식을 제시합니다. 제안된 방법인 강화된 모드 규제(Reinforced Mode Regulation, RMR)는 트랜스포머의 값 캐시가 특정 방향으로 과도하게 자기 강화되는 경향을 저랭크 감쇠를 통해 직접적으로 규제합니다. 실험 결과, RMR은 기존 방식보다 훨씬 낮은 엔트로피율에서도 안정적이고 고품질의 텍스트 생성을 가능하게 함으로써 모드 붕괴 문제를 효과적으로 완화함을 입증했습니다.

llmmode-collapsegenerative-models
7시간 전2
arXiv논문

대규모 모바일 네트워크의 무감독 이상 탐지를 위한 확장 가능한 컨텍스트 인식 그래프Attention

본 논문은 대규모 모바일 네트워크 환경에서 발생하는 이상 징후를 탐지하기 위한 'C-MTAD-GAT'라는 새로운 무감독(unsupervised) 이상 탐지 프레임워크를 제안합니다. 이 모델은 시간적 및 특징별 그래프 어텐션 메커니즘을 결합하고, 컨텍스트 조건부 처리를 통해 복잡한 네트워크 요소들의 고차원 KPI 시계열 데이터를 효과적으로 분석합니다. 실험 결과, C-MTAD-GAT는 기존의 베이스라인 대비 높은 성능을 보였으며, 실제 모바일 네트워크 운영 환경에서도 실행 가능하고 도메인 간 확장성이 입증되었습니다.

anomaly-detectionmobile-networksgraph-attention
7시간 전2
arXiv논문

AI 가속화된 CFD 시뮬레이션의 IPU 플랫폼 적응

본 논문은 AI 접근법을 활용하여 전통적인 CFD 시뮬레이션을 가속화하는 방법을 다루며, 특히 IPU-POD16 플랫폼에 최적화된 솔루션을 제시합니다. 연구진은 Poplar SDK와 커스텀 TensorFlow를 사용하여 CFD 응용 프로그램을 훈련시키고, 'popdist' 라이브러리를 통해 데이터 공급 병목 현상을 해결하여 최대 34%의 속도 향상을 달성했습니다. 또한, IPU 간 통신을 활용한 데이터 병렬성을 통해 처리량을 크게 개선할 수 있음을 입증했습니다.

cfdai-simulationipu
7시간 전2
arXiv논문

PAMod: 비정규 시계열 예측을 위한 위상 - 진폭 변조 기반 순환적 분포 변화 모델링

PAMod는 실제 세계의 비정상적인 통계적 특성을 가진 시계열 데이터 예측을 위한 새로운 프레임워크입니다. 이 모델은 위상-진폭 변조(Phase-Amplitude Modulation)를 사용하여 순환 패턴을 따르는 분포 변화를 정규화된 특징 공간에서 효과적으로 모델링합니다. PAMod는 평균과 분산의 주기적 변화를 적응적으로 포착하며, 기존 시계열 예측 방법론에 쉽게 통합할 수 있는 강력하고 효율적인 솔루션을 제공합니다.

time-seriesnon-stationarityphase-amplitude-modulation
7시간 전2
arXiv논문

부분 자동화 운전 시스템에서 의미 있는 인간 제어 (MHC) 평가: 행동과 인식의 연결

본 연구는 부분 자동화 운전 시스템 환경에서 '의미 있는 인간 제어(MHC)'를 경험하는 정도를 평가하기 위한 새로운 방법을 제시했습니다. 24명의 운전자들을 대상으로 촉각 공유 제어 및 거래된 제어 모드 하에 시뮬레이터 실험을 진행하고, 행동 데이터와 주관적 설문조사를 결합하여 분석했습니다. 연구 결과, 자동화 차량의 이해도와 조향 토크 충돌 간의 음의 상관관계가 확인되었으며, 운전자 의도와 일치하는 미묘한 촉각 안내가 MHC를 높이는 긍정적인 효과를 가짐을 발견했습니다. 따라서 미래 시스템 설계는 무리 없는 개입과 자동화 의도의 투명한 전달에 중점을 두어야 합니다.

human-machine-interactionautonomous-vehicleshaptic-feedback
7시간 전2
arXiv논문

Space Network of Experts: Architecture 및 Expert Placement

본 논문은 우주 데이터 센터에서 대규모 언어 모델(LLMs)을 효율적으로 분산 배포하는 'Space Network of Experts (Space-XNet)' 프레임워크를 제안합니다. 이 프레임워크는 MoE(Mixture-of-Experts) 모델의 특성을 활용하여, LLM의 구성 요소들을 여러 위성 네트워크에 최적화된 방식으로 배치하고 매핑하는 두 단계의 전략을 제시합니다. 실험 결과, Space-XNet은 기존 방식 대비 최소 3배의 지연 시간 감소 효과를 입증하며 우주 기반 AI 컴퓨팅의 실현 가능성을 높입니다.

llmsspace-computingmoe
7시간 전2
arXiv논문

LLM 지향 정보 검색: 노이즈 제거를 최우선으로 한 관점

본 논문은 LLM 기반의 정보 검색(IR) 환경에서 '노이즈 제거'가 핵심 병목 현상임을 강조한다. LLMs는 인간과 달리 주의 예산 제약으로 인해 노이즈에 취약하며, 이는 환각 및 추론 실패를 유발할 수 있다. 따라서 본 논문은 접근 불가능성부터 검증 불가능성에 이르는 4단계 프레임워크를 제시하고, 인덱싱, 리트리벌, 문맥 엔지니어링 등 정보 파이프라인 전반에 걸친 노이즈 최적화 기법을 체계적으로 분류한다.

llminformation-retrievalrag
7시간 전4
arXiv논문

SAGA: GPU 클러스터에서의 AI 에이전트 추론을 위한 워크플로우 원자 스케줄링

본 논문은 기존 GPU 스케줄러가 LLM 에이전트의 연쇄 호출(워크플로우)을 독립적으로 취급하여 발생하는 심각한 지연 시간 증가 문제를 해결하기 위해 'SAGA'라는 새로운 분산 스케줄러를 제안합니다. SAGA는 개별 추론 호출 대신 전체 에이전트 워크플로우 자체를 스케줄링 단위로 간주하는 프로그램 수준의 접근 방식을 채택했습니다. 이를 통해 KV 캐시 재사용을 최적화하고, 세션 친화적인 배치 및 공정한 자원 할당 메커니즘을 구현하여, 기존 시스템 대비 작업 완료 시간을 크게 단축시키고 GPU 메모리 활용도를 개선함을 입증했습니다.

llm-schedulinggpu-clusteringai-agents
8시간 전1
arXiv논문

실리콘 쇼다운: 소비자용 LLM 추론의 성능, 효율성 및 생태계 장벽

본 기사는 소비자 하드웨어에서 대규모 언어 모델(LLM)을 추론하는 현황과 관련된 기술적 과제들을 분석합니다. Nvidia와 Apple Silicon 생태계를 비교하며, LLM 배포를 위한 아키텍처별 트레이드오프를 제시합니다. 핵심적으로, Nvidia는 높은 처리량을 제공하지만 복잡한 런타임 제약 조건(지연 시간 vs. 생성 속도)과 VRAM 한계에 직면하는 반면, Apple은 통합 메모리 구조(UMA) 덕분에 대규모 모델을 효율적으로 확장하고 전력 효율성에서 우위를 점합니다.

llm-inferencehardware-accelerationapple-silicon
8시간 전4
arXiv논문

A11y-Compressor: 시각적 컨텍스트 재구성 및 중복 감소 를 통한 GUI 에이전트 관측 효율성 향상 프레임워크

A11y-Compressor는 GUI와 상호작용하는 AI 에이전트가 신뢰할 수 있는 관측 표현을 얻도록 돕는 프레임워크입니다. 기존의 접근성 트리는 중복성이 높고 공간적 구조 정보가 부족하다는 단점이 있습니다. 이 프레임워크는 시각적 컨텍스트 재구성 및 중복 감소를 통해 선형화된 접근성 트리를 컴팩트하고 구조화된 표현으로 변환하며, 이를 통해 OSWorld 벤치마크에서 토큰을 크게 줄이고 에이전트의 작업 성공률을 개선하는 성능을 입증했습니다.

gui-agentsaccessibility-treellm-grounding
8시간 전1

이 피드 구독하기

본 페이지의 콘텐츠는 AI가 공개된 소스를 기반으로 자동 수집·요약·번역한 것입니다. 원 저작권은 각 원저작자에게 있으며, 각 게시물의 “원문 바로가기” 링크를 통해 원문을 확인할 수 있습니다. 저작권자의 삭제 요청이 있을 경우 신속히 조치합니다.