© 2026 Molayo

Insights

AI가 자동으로 큐레이션·번역·정리하는 기술 동향 피드입니다.

arXiv cs.AI 2012건필터 해제

Goedel-Architect: 청사진 생성 및 정교화를 통한 형식적 정리 증명(Formal Theorem Proving)의 효율화

Lean 4 기반의 형식적 정리 증명을 위한 에이전트 프레임워크인 Goedel-Architect를 소개합니다. 청사진 생성 및 정교화 전략을 통해 기존의 비효율적인 재귀적 분해 방식을 개선했습니다. DeepSeek-V4-Flash를 백본으로 사용하여 수학적 벤치마크에서 최첨단 성능을 기록했습니다.

Code2LoRA: 소프트웨어 진화에 따른 코드 언어 모델을 위한 하이퍼네트워크 생성 어댑터

Code2LoRA는 저장소 수준의 컨텍스트를 추론 오버헤드 없이 주입하기 위해 하이퍼네트워크를 사용하여 저장소별 LoRA 어댑터를 생성하는 프레임워크입니다. 정적 코드베이스를 위한 Static 버전과 진화하는 코드베이스를 위한 Evo 버전을 지원하며, 새로운 벤치마크인 RepoPeftBench를 통해 성능을 입증했습니다.

MLEvolve: 자동화된 머신러닝 알고리즘 발견을 위한 자기 진화형 프레임워크

MLEvolve는 머신러닝 알고리즘 발견을 위해 설계된 LLM 기반의 자기 진화형 멀티 에이전트 프레임워크입니다. 트리 탐색 확장, 회고적 메모리, 적응형 코딩 모드를 통해 장기적인 최적화 문제를 해결하며 MLE-Bench에서 최첨단 성능을 기록했습니다.

TempoVLA: 속도 조절이 가능한 시각-언어-행동 (Vision-Language-Action) 정책 학습

TempoVLA는 로봇 조작 시 실행 속도를 유연하게 조절할 수 있는 새로운 시각-언어-행동(VLA) 모델입니다. 데이터 증강 기술인 VSTA와 조건화 메커니즘을 결합하여, 고정된 속도에서 벗어나 작업 단계에 따른 동적 속도 제어를 가능하게 합니다.

모든 곳에서 동시에 모든 것을 벤치마킹하기

LLM 및 MLLM 평가의 한계를 극복하기 위해 벤치마크 구축 과정을 자동화하는 자율 에이전트 시스템인 Benchmark Agent를 소개합니다. 이 프레임워크는 데이터 주석부터 품질 관리까지 전체 파이프라인을 조율하여 고품질의 벤치마크를 생성합니다.

멀티 채널 신호 트랜스포머(Multi-Channel Signal Transformers)를 위한 입력 인코더의 실증적 감사

멀티 채널 스칼라 신호를 처리하는 트랜스포머의 8가지 입력 인코더를 실증적으로 분석한 연구입니다. 실험 결과, 표준적인 채널별 선형 투영 방식이 대부분의 복잡한 대안들과 실무적으로 거의 동등한 성능을 보임을 확인했습니다.

실제 MCP 서버에서의 설명-코드 불일치: 측정, 탐지 및 보안적 함의

MCP 서버에서 도구의 자연어 설명과 실제 코드 구현이 일치하지 않는 '설명-코드 불일치(DCI)' 문제를 정의하고 분석한 연구입니다. 연구팀은 자동 검증 프레임워크인 DCIChecker를 개발하여 대규모 데이터셋을 통해 DCI의 광범위한 발생과 보안 위험성을 입증했습니다.

Archi: CMS 실험에서의 에이전트 기반 운영 (Agentic Operations)

Archi는 이질적인 데이터를 수집하고 검색 및 추론할 수 있는 오픈 소스 에이전트 프레임워크입니다. CERN의 CMS 실험 운영팀에 배포되어 문서와 실시간 모니터링 데이터를 결합한 기술 운영 지원 성능을 입증했습니다.

뇌 재구성을 위한 Sequential Mamba 기반의 Coarse-to-fine 계층적 구조

인간의 시각 피질 구조를 모방한 CHASMBrain 프레임워크를 제안합니다. Mamba 기반의 듀얼 스트림 설계를 통해 이미지-to-fMRI 인코딩 성능을 극대화하며, 기존 베이스라인 모델들을 능가하는 성과를 보였습니다.

차수 축소 선형 최적 제어를 통한 비디오 생성 모델의 활성화 스티어링 (Activation Steering)

비디오 생성 모델의 유해 콘텐츠 생성을 억제하기 위해 차수 축소 최적 제어 프레임워크인 LA-LQR을 제안합니다. 이 방식은 모델의 시각적 품질을 유지하면서도 동적 시스템 제어를 통해 원하는 특징으로 활성화를 유도합니다.

인간-AI 상호작용에서의 다중 에이전트 상보성(Multi-Agent Complementarity)에 대한 트리 기반 형식화

인간-AI 상호작용(HAI)에서 상보성을 정의하기 위한 트리 기반 형식화 프레임워크를 제안합니다. 다중 에이전트 프로토콜을 트리 구조로 모델링하여, 회귀 작업에서의 상보성 달성 가능성과 분류 작업에서의 한계를 수학적으로 증명합니다.

AIP: 에이전트 기술 학습 및 제어를 위한 그래프 표현 방식

에이전트 기술을 자유 형식의 산문 대신 유향 실행 그래프로 모델링하는 AIP(Agent Instruction Protocol)를 제안합니다. 이 방식은 에이전트의 행동을 결정론적 단계와 타입 지정된 엣지로 구조화하여 신뢰성을 높이고 개선을 용이하게 합니다.

NoRA: 시각적 1인칭 규범적 행동 추론에서의 근거 기반 합리성 평가

시각적 1인칭 환경에서 에이전트의 규범적 행동과 그 근거를 평가하는 새로운 벤치마크 NoRA를 제안합니다. 기존의 단순 선택 방식에서 벗어나, 사실-이유-행동 지원 그래프를 통해 모델이 행동의 정당성을 시각적 근거로 입증할 수 있는지 측정합니다.

얕은 안전성을 넘어선 추론 시점의 취약성: 생성 경로(Generation Trajectories)를 따른 정렬

LLM의 안전 정렬이 초기 토큰에만 집중되어 생성 과정 중 발생하는 토큰 주입에 취약하다는 점을 분석합니다. 생성 경로(Generation Trajectories)를 따라 모델을 직접 정렬함으로써 추론 시점의 공격에 대한 강건성을 높이는 새로운 방법론을 제안합니다.

BiasGRPO: 고분산 보상 환경에서 그룹 상대적 정책 최적화(GRPO)를 통한 편향 완화 안정화

LLM의 사회적 편향 완화를 위해 GRPO를 활용한 새로운 프레임워크 BiasGRPO를 제안합니다. 기존 DPO의 탐색 부족과 PPO의 학습 불안정성을 해결하기 위해 그룹 상대적 보상 정규화 방식을 사용합니다.

아마도 대략적으로 안전한 보장을 갖는 위험 인식 강화학습을 위한 시나리오 생성

심층 강화학습 에이전트의 안전성을 보장하기 위해 VAE를 활용한 위험 인식 시나리오 생성 연구를 소개합니다. 확률적 장벽 증명서를 구축하여 안전 영역의 상한과 하한을 정밀하게 추정하고, 비강건 영역을 샘플링하여 안전 보장의 신뢰도를 높이는 이중 최적화 방법을 제안합니다.

행동하며 배우기: 온라인 평생 학습 에이전트를 위한 기술 강화 테스트 시간 공동 진화 프레임워크

온라인 평생 학습 에이전트의 성능을 높이기 위한 2단계 강화학습 프레임워크인 LifeSkill을 제안합니다. 검증자 가이드 기술 학습과 온라인 기술 내재화 방식을 통해 에이전트가 테스트 시간 피드백을 파라미터에 직접 내재화하도록 돕습니다.

목적 함수 등가성을 넘어: 차량 경로 문제(VRP)에서의 LLM 기반 최적화 모델링을 위한 제약 조건 주입 (Constraint

LLM이 최적화 문제를 코드로 변환할 때 발생하는 제약 조건 누락 및 오류를 해결하기 위한 '제약 조건 주입(Constraint Injection)' 방식을 제안합니다. VRP 문제를 대상으로 VRPCoder 모델과 새로운 검증 벤치마크를 개발하여 기존 모델 대비 탁월한 성능을 입증했습니다.

R-APS: 반사적 적대적 파레토 탐색(Reflective Adversarial Pareto Search)을 통한 제약 조건 기반 설계를 위한

LLM 에이전트의 신뢰성 문제를 해결하기 위해 추론 모드 분해를 활용한 R-APS 방법론을 제안합니다. 미세 조정 없이 구조화된 프로토콜만으로 강건성과 효율성을 동시에 높여 로보틱스 설계 분야에서 뛰어난 성능을 입증했습니다.

OA-CutMix: CutMix의 레이블 편향(Label Bias) 교정

CutMix의 레이블 할당 방식이 객체의 실제 의미론적 기여도를 반영하지 못하는 레이블 편향 문제를 지적합니다. 이를 해결하기 위해 세그멘테이션 마스크를 활용하여 객체 면적에 비례해 레이블을 할당하는 OA-CutMix를 제안합니다.

이 피드 구독하기

RSSFeedly, Inoreader 등으로 구독

API/api/search?q=검색어

AIllms.txt로 AI 크롤링 가이드

본 페이지의 콘텐츠는 AI가 공개된 소스를 기반으로 자동 수집·요약·번역한 것입니다. 원 저작권은 각 원저작자에게 있으며, 각 게시물의 “원문 바로가기” 링크를 통해 원문을 확인할 수 있습니다. 저작권자의 삭제 요청이 있을 경우 신속히 조치합니다.