© 2026 Molayo

Insights

AI가 자동으로 큐레이션·번역·정리하는 기술 동향 피드입니다.

arXiv cs.AI 2159건필터 해제

코드의 청결도가 코딩 에이전트(Coding Agents)에 영향을 미치는가? 통제된 최소 쌍(Minimal-Pair) 연구

본 연구는 코드의 구조적·스타일적 청결도가 자율 코딩 에이전트의 성능에 미치는 영향을 최소 쌍(Minimal-Pair) 실험을 통해 분석했습니다. Claude Code를 활용한 실험 결과, 코드 청결도가 에이전트의 작업 성공률에는 영향을 주지 않았으나, 토큰 사용량과 파일 재방문 횟수 등 운영 효율성 측면에서는 유의미한 차이를 만드는 것으로 나타났습니다.

비평가들이 의견이 일치하지 않을 때: RIS 지원 무선 제어 시스템에서의 적응형 보상 오염 공격

본 논문은 RIS 지원 무선 네트워크 환경에서 Soft Actor-Critic(SAC) 에이전트를 대상으로 하는 새로운 적응형 보상 오염 공격인 DGRP를 제안합니다. DGRP는 SAC의 이중 비평가 간 불일치가 발생하는 지점을 공략하여 가치 추정을 왜곡하고 정책을 차선책으로 유도함으로써 네트워크 성능을 저하시킵니다. 연구 결과, DGRP는 기존의 주기적 또는 탐색 트리거 방식보다 더 큰 피해를 입히며 심층 강화학습의 강건성 확보를 위한 불일치 인지 위협 고려의 중요성을 시사합니다.

Embodied LLM 탐색: 관찰 충실도가 높을 때 문제 해결 능력이 저하되는 현상

본 연구는 체화된 LLM(Embodied LLM) 에이전트가 완벽한 정답 관찰(ground-truth symbolic observations)을 제공받을 때 오히려 문제 해결 능력이 저하되는 역설적인 현상을 분석합니다. 실험 결과, 적절한 수준의 노이즈가 포함된 RGB 입력 환경에서 에이전트의 성능이 가장 높게 나타났으며, 이는 노이즈가 반복적인 행동 루프를 줄여주는 역할을 하기 때문입니다. 결과적으로 LLM의 성능 평가 시 단순 성공률뿐만 아니라 지각 오류와 추론 실패 간의 상호작용을 고려해야 함을 시사합니다.

실제 ROS 2 시스템을 위한 LLM 지원 아키텍처 복구 연구: 계층적 구조 아키텍처 재구성을 위한 에이전트 기반 다단계 접근 방식

본 연구는 ROS 2 기반 로봇 시스템의 분산된 소스 코드와 런치 파일로부터 계층적 소프트웨어 아키텍처를 복구하기 위한 LLM 지원 에이전트 기반 접근 방식을 제안합니다. 정교한 프롬프팅과 다단계 중간 아키텍처 표현을 통해 기존 방식의 한계였던 추상화 수준별 계층 구조 복구 문제를 해결하고자 합니다. 실제 협동 로봇 팔 시스템을 통해 검증한 결과, 아키텍처 복구의 일관성과 확장성 측면에서 향상된 성능을 확인했습니다.

확률 보존 흐름 가이드 (Probability-Conserving Flow Guidance)

기존의 Classifier-Free Guidance(CFG) 방식이 생성 매니폴드의 기하학적 구조를 무시하여 확률 보존을 깨뜨리는 문제를 분석합니다. 본 연구는 연속 방정식을 통해 가이드 효과를 점수 평행 항과 발산 항으로 분해하고, 이를 제어하는 적응형 매니폴드 가이드(AdaMaG)를 제안합니다. AdaMaG는 추가 비용 없이 이미지의 사실성을 높이고 환각 현상을 줄이며 채도 저하 문제를 개선합니다.

진화적 코딩 에이전트(Evolutionary Coding Agents)는 무엇을 진화시키는가?

진화적 코딩 에이전트가 성능을 높이는 실제 메커니즘을 분석하기 위해 새로운 데이터셋인 EvoTrace와 분석 방법론인 EvoReplay를 제안합니다. 연구 결과, 성능 향상이 반드시 새로운 알고리즘 구조의 발견을 의미하지는 않으며, 삭제된 코드를 다시 도입하는 결정론적 순환 패턴이나 평가기에 대한 과적합 등 다양한 요인이 작용함을 밝혀냈습니다.

VL-DPO: 선호도 정렬된 자율 주행을 위한 시각-언어 가이드 미세 조정

VL-DPO는 시각-언어 모델(VLM)을 활용하여 자율 주행 모델의 동작 예측을 인간의 선호도에 정렬시키는 새로운 프레임워크입니다. VLM을 제로샷 추론기로 사용하여 선호도 쌍을 자동으로 생성하고, 이를 Direct Preference Optimization(DPO) 방식으로 미세 조정하여 주행 성능을 개선합니다. 실험 결과, 기존 사전 학습 모델 대비 인간 선호도 점수(RFS)는 향상되고 평균 변위 오차(ADE)는 감소하는 성과를 거두었습니다.

INSHAPE: 해석 가능한 시계열 분류를 위한 인스턴스 수준의 Shapelets

INSHAPE는 기존의 집단 수준(population-level) shapelet 방식이 가진 한계를 극복하기 위해 제안된 해석 가능한 시계열 분류(TSC) 프레임워크입니다. 각 시계열 인스턴스에 특화된 가변 길이의 패턴을 식별하고 패턴 간의 시간적 의존성을 모델링하여, 높은 예측 성능과 함께 국소적 및 전역적 해석 가능성을 동시에 제공합니다.

추론 시점 논증을 위한 신경 기호 학습 (Neurosymbolic Learning for Inference-Time Argumentation)

본 논문은 의료 및 금융과 같은 고위험 환경에서 불완전하거나 상충하는 정보에 대응하기 위해 3진 주장 검증(참/거짓/불확실)을 수행하는 신경 기호(neurosymbolic) 프레임워크인 ITA를 제안합니다. ITA는 형식적 논증 의미론을 활용하여 모델이 논증을 생성하고 점수를 매기도록 학습하며, 추론 시에는 사후 설명이 아닌 구조적으로 검증 가능한 논증을 바탕으로 최종 판결을 도출합니다. 실험 결과, ITA는 기존 논증 기반 모델보다 우수한 성능을 보였으며 비논증적 직접 예측 모델과 경쟁할 수 있는 수준의 성능과 함께 명시적인 검사 가능성을 제공합니다.

초안 작성은 줄이고 검색은 늘리기: Speculative Decoding을 위한 하이브리드 트리 구축

Speculative Decoding의 속도 향상을 위해 초안 트리의 연산 오버헤드와 수락률 사이의 트레이드오프를 해결하는 새로운 프레임워크인 Graft를 제안합니다. Graft는 가지치기(pruning)를 통해 확보된 연산 예산을 검색(retrieval)에 활용하여, 추가 학습 없이도 가지치기로 인한 손실을 보완하고 추론 속도를 극대화합니다. 실험 결과, 짧은 문맥에서는 최대 5.41배, 대규모 모델에서는 기존 방식 대비 최대 21.8%의 속도 향상을 달성했습니다.

JEPAs에서의 등방성(Isotropy)을 넘어: Hamiltonian 기하학 및 Symplectic 예측

본 논문은 기존 JEPA(Joint-Embedding Predictive Architecture)가 사용하는 등방성 가우시안 정규화가 구조화된 다운스트림 기하학을 반영하지 못하는 한계를 지적합니다. 이를 해결하기 위해 각 뷰를 위상 공간 상태로 인코딩하고 Hamiltonian leapfrog 맵을 통해 뷰 간 전이를 예측하는 HamJEPA를 제안합니다. 실험 결과, HamJEPA는 CIFAR-100 및 ImageNet-100 데이터셋에서 기존 SIGReg 대비 kNN 및 선형 프로브 성능을 크게 향상시켰습니다.

미지의 비선형 동역학을 위한 k-귀납적 신경 장벽 인증서 (k-Inductive Neural Barrier Certificates)

본 논문은 기존의 엄격한 이산 시간 장벽 인증서 조건을 완화하여, 임시적인 수치 증가를 허용하는 k-귀납적 신경 장벽 인증서(k-NBCs)를 제안합니다. 신경망을 활용해 미지의 비선형 시스템에 대한 확장성을 확보하면서도, 데이터 기반의 표현 학습과 CEGIS-SMT 프레임워크를 결합하여 시스템 동역학에 대한 사전 지식 없이도 안전성을 공식적으로 검증할 수 있는 방법을 제시합니다.

예측 정확도를 넘어: 모델-뇌 정렬 평가를 위한 타겟 공간 복구 프로파일 (Target-Space Recovery Profiles)

본 연구는 인공 시각 모델이 뇌의 반응을 예측할 때 단순한 예측 정확도를 넘어, 뇌의 어떤 반응 차원이 복구되는지를 분석하는 '타겟 공간 복구 프로파일(Target-Space Recovery Profiles)' 프레임워크를 제안합니다. fMRI 데이터를 활용해 재현 가능한 뇌 반응 차원을 식별하고, 모델이 이러한 차원을 얼마나 정확하게 재현하는지 정량화함으로써 모델-뇌 정렬을 더욱 정밀하게 진단합니다. 이를 통해 유사한 예측 정확도를 가진 모델이라도 실제 뇌의 반응 구조를 재현하는 방식은 다를 수 있음을 입증했습니다.

Lean 4에서 AI 지원 정리 증명을 위한 Aristotle API 활용: Grasshopper 문제의 형식화 사례 연구

본 논문은 IMO 2009의 Grasshopper 문제를 Lean 4로 형식화하여 Aristotle API를 통한 AI 지원 정리 증명 과정을 분석한 사례 연구입니다. AI는 4개의 보조 보조정리를 검증하는 데 성공했으나, 전역적 조합론적 논리가 필요한 메인 정리는 해결하지 못한 채 'sorry' 상태로 남겨두었습니다. 이는 AI가 국소적 증명 탐색에는 강점이 있지만, 복잡한 전역적 장부 정리에는 한계가 있음을 보여줍니다.

Toto 2.0: 시계열 예측이 스케일링 시대에 진입하다

Toto 2.0은 시계열 예측 분야에서 스케일링 법칙이 적용 가능함을 입증한 파운데이션 모델 제품군입니다. 4M에서 2.5B 파라미터 규모까지 확장 가능한 단일 학습 레시피를 통해 BOOM, GIFT-Eval, TIME 등 주요 벤치마크에서 SOTA 성능을 달성했습니다.

모든 루브릭이 동일하게 가르치는 것은 아니다: RLVR을 위한 정책 인식 루브릭 보상 (Policy-Aware Rubric Rewards)

강화학습(RL)에서 루브릭 기반 보상을 사용할 때, 인간이 부여한 기준의 중요도와 학습에 유용한 신호가 일치하지 않는 문제를 해결하기 위한 POW3R 프레임워크를 제안합니다. POW3R은 정책의 현재 상태에 따라 기준별 보상 가중치를 동적으로 조정하여, 롤아웃을 효과적으로 구분할 수 있는 기준에 집중함으로써 학습 효율을 극대화합니다. 실험 결과, 기존 GRPO 방식보다 훨씬 적은 학습 단계만으로도 더 높은 평균 보상과 완결성을 달old했습니다.

HaorFloodAlert: 방글라데시 Haor 습지의 72시간 홍수 예측을 위한 탈계절화된 머신러닝 (ML) 앙상블

방글라데시 Haor 습지의 돌발 홍수를 예측하기 위해 탈계절화된 머신러닝 앙상블 모델인 HaorFloodAlert를 개발했습니다. 이 시스템은 Sentinel-1 SAR 데이터를 활용하여 72시간 전 홍수 확률을 예측하며, 계절적 요인에 의한 정확도 왜곡을 방지하도록 설계되었습니다. 또한 3단계 경보 파이프라인과 쌀 피해 추정기를 포함하여 실질적인 농업 보호를 목표로 합니다.

프로덕션 LLM 에이전트를 위한 런타임 아키텍처 패턴 선택 및 구성 방법론

본 논문은 확률적 LLM 출력과 결정론적 소프트웨어 시스템 사이의 경계인 '확률적-결정론적 경계(SDB)'를 정의하고, 이를 기반으로 한 프로덕션 LLM 에이전트 런타임 아키텍처 패턴을 제안합니다. 에이전트의 유형에 따라 선택할 수 있는 6가지 런타임 패턴 카탈로그와 패턴 선택 방법론, 그리고 모델 변경 시 발생하는 '리플레이 발산(replay divergence)' 현상을 분석합니다.

사고의 원자: Microstates를 이용한 범용 EEG 표현 학습

본 논문은 EEG 신호를 미세한 시간 규모의 뇌 활동 패턴인 마이크로스테이트(microstates)로 변환하여 범용적인 표현을 학습하는 방법을 제안합니다. 연속적인 EEG 신호를 이산적인 마이크로스테이트 시퀀스로 클러스터링하여 토크나이저를 구축하며, 이는 수면 단계 분류 및 감정 인식 등 다양한 다운스트림 태스크에서 기존 방식보다 뛰어난 성능을 보입니다.

Answer Set Programming을 통한 장기 전력망 계획

본 논문은 장기 전력망 계획 프로세스를 자동화하고 최적화하기 위해 Answer Set Programming(ASP)을 활용하는 새로운 접근 방식을 제안합니다. 기존 계획 언어로는 표현하기 까다로운 복잡한 위상적 및 조합론적 불변량을 ASP를 통해 간결하게 인코딩함으로써 전력망의 지속 가능성과 서비스 품질을 유지하는 방법을 다룹니다.

이 피드 구독하기

RSSFeedly, Inoreader 등으로 구독

API/api/search?q=검색어

AIllms.txt로 AI 크롤링 가이드

본 페이지의 콘텐츠는 AI가 공개된 소스를 기반으로 자동 수집·요약·번역한 것입니다. 원 저작권은 각 원저작자에게 있으며, 각 게시물의 “원문 바로가기” 링크를 통해 원문을 확인할 수 있습니다. 저작권자의 삭제 요청이 있을 경우 신속히 조치합니다.