© 2026 Molayo

Insights

AI가 자동으로 큐레이션·번역·정리하는 기술 동향 피드입니다.

arXiv cs.AI 2012건필터 해제

Squeeze-Release: 정확한 구조적 최소화를 통한 반복적 가지치기 (Iterative Pruning)

Squeeze-Release는 가지치기(Pruning)와 최소화(Minimization)를 반복하여 모델의 구조적 중복성을 제거하는 새로운 연구입니다. 이를 통해 모델의 정확도를 유지하면서도 크기를 획기적으로 줄이는 정확한 구조적 재작성 방식을 제안합니다.

분산 및 복합 AI 시스템을 위한 설계 방법론 및 성능 트레이드오프 관리

단일 모델 중심의 한계를 극복하기 위해 여러 모델과 도구를 오케스트레이션하는 복합 AI(Compound AI) 시스템 설계 방법론을 제안합니다. 워크플로 토폴로지와 구성 선택을 통해 정확도는 유지하면서 지연 시간과 비용을 획기적으로 절감하는 8가지 설계 패턴을 제시합니다.

PLAIground: Edge-Cloud-Space 연속체 내 복합 AI 시스템을 위한 SLO 기반 런타임 모델 선택

Edge-Cloud-Space 연속체 내 복합 AI 시스템의 SLO 준수를 위한 프레임워크 PLAIground를 제안합니다. CAIM 추상화와 Pixie 알고리즘을 통해 워크플로우 변경 없이 실행 중 최적의 모델을 동적으로 선택합니다.

탄성 쿼리 강화학습 (Elastic Queries Reinforcement Learning): VLA 모델을 위한 자기 인식 정책 실행

VLA 모델의 경직된 추론 일정을 개선하기 위해 탄성 쿼리 강화학습(EQRL) 프레임워크를 제안합니다. 상태 난이도에 따라 계산 자원을 유동적으로 배분하여, 작업 성공률을 유지하면서도 추론 비용을 효율적으로 절감합니다.

가설 중복성 하에서의 발견: 발견 병목 현상에 대한 기하학적 이론

과학적 발견 과정에서 가설 중복성으로 인한 병목 현상을 해결하기 위한 기하학적 이론을 제시합니다. LLM의 비국소적 제안이 효과를 발휘하기 위한 세 가지 기하학적 조건인 탐색 압축, 직교 탈출, 잔차 신호 정렬을 정의하고 이를 검증합니다.

Hy-Embodied-0.5-VLA: Vision-Language-Action 모델에서 실제 환경의 로봇 학습 스택까지

Hy-Embodied-0.5-VLA(HyVLA-0.5)는 데이터 수집부터 모델 설계, 미세 조정, 강화학습, 실제 환경 배포까지 아우르는 엔드 투 엔드 로봇 학습 스택을 제안합니다. Vision-Language-Action(VLA) 모델을 통해 실제 환경에서의 로봇 제어 성능을 극대화하는 시스템을 다룹니다.

CSPO: 안전한 강화학습을 위한 제약 조건 민감 정책 최적화

안전한 강화학습(Safe RL)에서 발생하는 진동 현상과 제약 조건 위반 문제를 해결하기 위한 CSPO 방법론을 제안합니다. 국소적 제약 조건 민감도를 정책 업데이트에 통합하여 KKT 해를 보존하고 더 빠른 안전 회복을 가능하게 합니다.

Monte Carlo Tree Search를 활용한 계획 수립을 위한 인과적 객체 중심 모델

COMET은 슬롯 구조화된 잠재 공간에서 몬테카를로 트리 탐색(MCTS)을 수행하는 새로운 모델 기반 강화학습 알고리즘입니다. 트랜스포머 기반 월드 모델과 객체-인과 어텐션을 결합하여 작업 관련 엔티티에 집중된 의사결정을 가능하게 합니다.

오디오 모델 내 설명의 인지된 취약성: 예측값의 변화 없는 속성(Attribution) 조작

오디오 딥페이크 탐지 모델의 사후 설명(post-hoc explanation) 방법론이 가진 취약성을 연구한 논문입니다. 심리음향학적 프레임워크를 통해 모델의 예측 결과는 유지하면서 설명 히트맵만 왜곡하는 공격 가능성을 입증했습니다.

도구가 결정할 때: LLM 에이전트는 Graph Neural Network 도구에 맹목적으로 의존하며, 강력한 백본일수록 더 많이 의존한다

LLM 에이전트가 GNN 도구를 사용할 때 스스로 판단하기보다 도구의 결과에 맹목적으로 의존하는 'GNN 앵무새' 현상을 분석한 연구입니다. 모델의 역량이 커질수록 오히려 도구에 대한 의존도가 높아지며, 이는 에이전트의 자율적 추론 능력을 저해할 수 있음을 경고합니다.

CADET: 물리 기반 인과적 감사 및 엔드투엔드(End-to-End) 주행 플래너의 훈련 없는 디컨파운딩 (Deconfounding)

자율주행 엔드투엔드 플래너가 통계적 지름길에 의존하는 인과적 혼동 문제를 해결하기 위한 CADET 프레임워크를 제안합니다. 별도의 재훈련 없이도 사전 훈련된 모델의 가짜 의존성을 감사하고 수정할 수 있는 것이 특징입니다.

크기 및 기능 전이가 가능한 해밀토니안 예측을 위한 고정점 신경 연산자 (Fixed-Point Neural Operator)

HamEvo는 단일 단계의 자기 일관적 업데이트를 학습하여 Kohn-Sham 해밀토니안을 예측하는 신경 연산자입니다. 기존 DFT 대비 최대 242배 빠른 속도로 분자 오비탈과 에너지 준위를 정확하게 예측하며, 퓨샷 파인튜닝을 통해 대규모 분자로의 확장성을 입증했습니다.

챗봇에서 디지털 동료로: 지속 가능한 자율 AI를 향한 패러다임 전환

LLM이 단순 챗봇을 넘어 추론, 메모리, 행동 능력을 갖춘 '디지털 동료'로 진화하는 패러다임 전환을 다룹니다. 사고형 LLM의 인지 능력 향상과 워크스테이션 시스템을 통한 도구 활용의 지속성 확보를 핵심으로 설명합니다.

밀집 좌표 목록 미세 조정(Dense Coordinate-List Fine-Tuning)이 시각-언어 모델(Vision-Language

시각-언어 모델(VLM)을 밀집 좌표 목록 출력 방식으로 미세 조정할 때 발생하는 구조적 출력 변화와 반복 문제를 연구합니다. Gemma 4 12B와 Qwen3-VL-8B를 통해 LoRA 어댑터 용량이 모델의 생성 및 제어 표면에 미치는 영향을 분석했습니다.

양자 이후 시대의 IoMT 미래 보안: 에지 네이티브 연합 학습 (Edge-Native Federated Learning) 접근 방식

양자 컴퓨팅 위협에 대응하여 IoMT 환경의 보안을 강화하기 위한 에지 네이티브 연합 학습(FL) 프레임워크를 제안합니다. Kubernetes 기반의 확장 가능한 구조를 통해 양자 내성 암호(PQC)를 통합하고 Raspberry Pi 테스트베드에서 그 효용성을 검증했습니다.

방패에서 타겟으로: LLM 기반 에이전트 가드레일에 대한 서비스 거부(DoS) 공격

LLM 기반 에이전트 가드레일의 추론 능력을 악용하여 무한 루프를 유발하는 서비스 거부(DoS) 공격 방식을 연구했습니다. 공격자는 정교한 페이로드를 통해 토큰 및 지연 시간을 대폭 증폭시켜 시스템을 마비시킬 수 있습니다.

확산 모델(Diffusion Approaches)을 이용한 지역 기후 모델 에뮬레이션: 생성형 머신러닝의 부가가치는 무엇인가?

확산 모델을 활용하여 지역 기후 모델(RCM)을 에뮬레이션하는 ParamDiffusion 프레임워크를 제안합니다. 연구 결과, 확산 기반 방식은 기후학적 강수 통계와 극한 상황을 재현하는 데 뛰어난 성능을 보였으나, 가장 극단적인 이벤트를 완벽히 포착하기에는 개선의 여지가 있음을 확인했습니다.

TRACE: 지연된 증거 기반 시각-운동 모방을 위한 궤적 라우팅 인과 메모리

지연된 증거가 존재하는 환경에서 로봇의 시각-운동 모방 성능을 높이기 위한 TRACE 프레임워크를 제안합니다. 경로 시그니처를 활용해 제한된 메모리에 핵심 증거를 저장하고 검색함으로써, 시각적으로 모호한 상황에서도 정확한 행동 결정을 내릴 수 있도록 돕습니다.

Global Average Pooling에 대한 재고: 당신의 분류기는 비밀리에 Multi-Instance Learner이다

현대 이미지 분류기의 Global Average Pooling(GAP) 구조가 본질적으로 Multiple-Instance Learning(MIL)과 유사하게 작동함을 분석합니다. 이를 통해 이미지 레벨의 예측이 틀리더라도 공간적 클래스 증거를 추출하고 사후 진단할 수 있는 방법을 제시합니다.

StreamMemBench: 미래 지향적 보조를 위한 에이전트 메모리의 스트리밍 평가

에이전트의 메모리 능력을 평가하기 위해 스트리밍 관찰 데이터로부터 미래의 작업을 보조하는 능력을 측정하는 StreamMemBench를 제안합니다. 기존 벤치마크가 놓쳤던 스트리밍 데이터 기반의 연속적인 작업 수행 능력을 4가지 지표로 진단합니다.

이 피드 구독하기

RSSFeedly, Inoreader 등으로 구독

API/api/search?q=검색어

AIllms.txt로 AI 크롤링 가이드

본 페이지의 콘텐츠는 AI가 공개된 소스를 기반으로 자동 수집·요약·번역한 것입니다. 원 저작권은 각 원저작자에게 있으며, 각 게시물의 “원문 바로가기” 링크를 통해 원문을 확인할 수 있습니다. 저작권자의 삭제 요청이 있을 경우 신속히 조치합니다.