© 2026 Molayo

Insights

AI가 자동으로 큐레이션·번역·정리하는 기술 동향 피드입니다.

arXiv cs.AI 2266건필터 해제

플레이할 이유: 최신 LRM과 인간 게임 학습 간의 행동 및 뇌 정렬

본 연구는 참가자들이 새로운 비디오 게임을 플레이하는 동안의 fMRI 데이터를 활용하여, 최신 대규모 추론 모델(LRMs)이 인간의 학습 및 의사 결정 과정을 얼마나 잘 모방할 수 있는지 탐구했습니다. 연구진은 LRM의 게임 플레이 능력, 인간 행동 일치도, 그리고 뇌 활동 예측 능력을 종합적으로 평가했으며, 이를 기존 강화학습 에이전트 및 베이지안 이론 기반 모델과 비교했습니다. 그 결과, 최신 LRM들이 게임 발견 과정에서 인간의 행동 패턴과 가장 유사하게 나타났으며, 특히 대뇌 및 피하피질 영역 전반에 걸쳐 기존 RL 대체 모델보다 우수한 뇌 활동 예측 능력을 보였습니다. 또한, 이러한 '뇌 정렬(brain alignment)'은 다운스트림 계획보다는 게임 상태에 대한 인컨텍스트 표현을 반영함을 입증했습니다.

Teacher로서의 궤적: 에너지 탐색 증류를 통한 소수 단계 이산 흐름 매칭

본 기사는 텍스트 생성 과정에서 사용되는 이산 흐름 매칭(Discrete flow matching)의 효율성 문제를 다룹니다. 기존 방식이 수백 번의 순방향 패스를 요구하는 반면, 증류를 통해 학생 모델이 이를 몇 단계로 재현하도록 학습합니다. 저자들은 성능 저하의 원인이 단순히 학생 모델의 용량 부족이 아니라, 오히려 학습에 사용되는 '궤적(trajectory)' 자체의 병목 현상에 있다고 주장하며, 궤적-샤프티(Trajectory-Shap) 기법을 제안합니다.

INO-SGD: 개별화된 차분 프라이버시 하에서의 유틸리티 불균형 문제 해결

본 논문은 개별화된 차분 프라이버시(IDP) 환경에서 발생하는 유틸리티 불균형 문제를 다룹니다. 민감한 데이터를 가진 소유자들이 더 강력한 프라이버시 요구사항을 설정할 때, 기존 알고리즘들은 이들의 데이터가 모델 훈련 과정에서 과소 대표되어 성능 저하를 초래하는 문제가 발생합니다. 이를 해결하기 위해 INO-SGD라는 새로운 알고리즘을 제안하며, 이는 각 배치 내 데이터를 전략적으로 다운-가중치하여 모든 반복 과정에서 높은 프라이버시 요구사항을 가진 데이터의 모델 성능을 개선합니다.

TraceFix: TLA+ 카운터예제를 이용한 에이전트 협업 프로토콜 복구

TraceFix는 대규모 언어 모델(LLM) 기반의 다중 에이전트 협업 시스템을 위한 검증 우선 파이프라인입니다. 이 시스템은 하나의 에이전트가 작업 설명으로부터 프로토콜 토폴로지를 합성하고, PlusCal 로직을 생성하며, TLA+ 모델 체커(TLC)에서 얻은 카운터예제를 활용하여 프로토콜을 반복적으로 복구 및 검증합니다. 최종적으로 검증된 프로세스는 에이전트별 시스템 프롬프트와 런타임 모니터를 통해 실행되어 협업 연산의 무결성을 보장합니다.

양자 영감 최적화(Quantum-Inspired Optimization)를 이용한 머신러닝의 비볼록성 탐색

본 논문은 고차원 또는 이상치로 오염된 환경에서 발생하는 어려운 비볼록 최적화 문제를 해결하기 위한 통합 프레임워크를 제안합니다. 전통적인 머신러닝 접근 방식의 한계점(지역 최소값에 빠지는 문제 등)을 극복하기 위해, 양자 중첩 개념에서 영감을 받은 양자 영감 진화 최적화(QIEO) 기법을 활용하여 전역 탐색 능력을 확보하는 것이 핵심입니다.

도구 호출(Tool Calling)은 언어 모델에서 선형적으로 읽고 조종 가능합니다

본 연구는 다양한 대규모 언어 모델(LLM)을 대상으로 도구 호출(Tool Calling) 메커니즘을 분석하여, 선택된 도구의 정체성이 모델 내부 활성화 값에 선형적으로 인코딩되어 있음을 발견했습니다. 이는 단순히 프롬프트에서 도구 이름을 변경하는 것만으로도 높은 정확도로 모델이 다른 도구를 선택하도록 조종할 수 있음을 의미합니다. 또한, 이러한 내부 표현 차이를 활용하여 잠재적인 오류를 사전에 감지하고 플래그 지정하는 것도 가능함을 보여줍니다.

매개변수 재구성을 통한 스파이킹 신경망의 전역 최적 훈련

스파이킹 신경망(SNNs)은 에너지 효율적이고 생물학적으로 그럴듯한 대안으로 주목받고 있지만, 스파이크 함수의 비미분성 때문에 훈련 시 유사 기울기(surrogate gradients)를 사용해야 하며 이는 근사 오차를 누적시킵니다. 본 연구는 이 문제를 해결하기 위해 병렬 순방향 임계 네트워크의 볼록화 기법을 병렬 순환 임계 네트워크로 확장하는 방법을 제안합니다.

기억의 저주: LLM 에이전트의 협력적 의도를 훼손하는 확장된 회상

본 논문은 LLM 에이전트가 다중 에이전트 환경에서 컨텍스트 창 확장이 오히려 협력적 의도를 저해하는 '기억의 저주(memory curse)' 현상을 발견했습니다. 500라운드 이상의 실험 결과, 접근 가능한 히스토리 증가는 상당수의 모델-게임 설정에서 협력을 떨어뜨리는 패턴을 보였습니다. 연구진은 이 실패가 단순한 편집증 증가보다는 에이전트의 미래 지향적 의도 침식과 관련되어 있음을 분석하고, 이를 검증하기 위해 미래 지향적인 내용으로만 훈련된 LoRA 어댑터를 제안했습니다.

루브릭 기반 강화학습 (RL): 일반화 가능한 추론을 위한 구조화된 심사위원 보상

본 기술 기사는 '루브릭 기반 강화학습(rubric-grounded reinforcement learning)'이라는 새로운 프레임워크를 제안합니다. 이 방법은 LLM 심사위원을 활용하여 응답을 여러 개의 가중치 부여되고 검증 가능한 기준(루브릭)으로 분해하고, 각 기준별로 점수를 매겨 부분 점수 최적화 신호를 제공하는 것이 핵심입니다. 이를 통해 정책이 단일한 전체 점수가 아닌 구조적이고 다중 기준의 보상에 따라 최적화될 수 있도록 합니다.

Flow-OPD: Flow Matching 모델을 위한 On-Policy Distillation

본 논문은 기존 Flow Matching (FM) 기반의 텍스트-이미지 생성 모델이 직면하는 보상 희소성 및 기울기 간섭 문제를 해결하기 위해 'Flow-OPD'라는 새로운 온-정책 증류(On-Policy Distillation) 사후 훈련 프레임워크를 제안합니다. Flow-OPD는 단일 보상 GRPO 미세 조정을 통해 도메인 특화 교사 모델들을 육성하고, 이를 활용하여 범용적인 텍스트-이미지 모델의 정렬 성능을 향상시킵니다.

VecCISC: 추론 과정 클러스터링 및 후보 답변 선택을 통한 신뢰도 기반 자기 일관성 개선

본 기사는 대규모 언어 모델(LLM)의 추론 시간 성능 개선 기법인 Self-Consistency를 다루며, 특히 후보 답변에 신뢰도 값을 할당하여 가중치 다수결 투표를 수행하는 CISC 방식의 정확성을 설명합니다. 하지만 이 과정에서 각 후보의 추론 과정을 비평가 LLM(critic LLM)을 호출하여 점수를 매겨야 하므로, 오버헤드와 비용이 크게 증가하는 문제가 있습니다.

EmambaIR: 이벤트 기반 이미지 재구성을 위한 효율적인 시각 상태 공간 모델

EmambaIR은 이벤트 기반 이미지 재구성을 위해 설계된 효율적인 시각 상태 공간 모델(SSM)입니다. 기존의 CNN이나 ViT 기반 방법들이 가지는 전역적 특징 포착의 어려움과 높은 시간 복잡도 문제를 해결합니다. 이 프레임워크는 크로스 모달 Top-k Sparse Attention Module (TSAM)과 Gated State-Space Module (GS)를 도입하여 공간적으로 희소하고 시간적으로 연속적인 이벤트 스트림을 효율적으로 처리하며 고해상도 재구성을 가능하게 합니다.

SpatialEpiBench: 공간 정보 및 전염병 사전 지식을 예측 모델 평가하기 위한 벤치마크

본 논문은 공중보건 환경에서 현실적인 공간시간적 전염병 예측 모델의 성능을 평가하기 위한 새로운 벤치마크인 SpatialEpiBench를 소개합니다. 기존의 단순한 시간 분할 방식으로는 실제 실시간 예측 능력을 반영하기 어렵다는 문제점을 해결하고자 했습니다. SpatialEpiBench는 표준화된 롤링 평가와 발병 특화 지표를 포함하여 총 11개의 전염병 데이터셋을 제공하며, 모델들이 직면하는 주요 실패 모드(예: 예견 능력 부족, 희소성 처리 어려움)를 분석하고 이를 개선하기 위한 자원(데이터, 코드, 가이드라인)을 공개합니다.

Ex Ante Evaluation of AI-Induced Idea Diversity Collapse

본 논문은 창의적 AI 시스템의 출력을 개별 유틸리티가 아닌 집단 수준에서 평가하는 새로운 프레임워크를 제시합니다. 아이디어가 많이 생산될수록 가치가 감소하는 '다양성 붕괴' 문제를 다루며, 이를 해결하기 위해 인간 상대적 프레임워크를 도입했습니다. 이 프로토콜은 실제 사용자 데이터 없이도 AI가 유발할 수 있는 과밀 위험을 사전에(ex ante) 추정하고, 모델의 집중도를 측정하여 다양성 붕괴를 예측하는 방법을 제공합니다.

Sparkle: Realizing Lively Instruction-Guided Video Background Replacement via

본 논문은 자연어 명령에 따른 비디오 배경 교체(Background Replacement)의 어려움을 다루며, 기존 데이터셋들이 이 복잡한 작업을 충분히 지원하지 못했음을 지적합니다. 이에 연구진은 앞뒤 가이드를 분리하여 생성하는 확장 가능한 파이프라인을 설계하고, 이를 통해 140K 비디오 쌍을 포함하는 새로운 Sparkle 데이터셋과 평가 벤치마크인 Sparkle-Bench를 공개했습니다. 이로써 배경 교체 작업의 품질 저하 문제를 해결하고 기존 모델 대비 월등히 높은 성능을 입증했습니다.

Learning to Cut: Reinforcement Learning for Benders Decomposition

본 논문은 불확실성 하의 2단계 확률적 프로그램을 해결하는 데 사용되는 Benders 분해(BD)의 느린 수렴 문제를 개선하기 위해 RLBD(Reinforcement Learning for BD) 프레임워크를 제안합니다. 이 프레임워크는 신경망 기반 정책을 사용하여 절단(cut)을 적응적으로 선택하며, REINFORCE 알고리즘과 같은 정책 경사 방법을 통해 훈련됩니다. 실험 결과, RLBD는 계산 효율성을 크게 향상시키고 다양한 차원의 문제에서도 강력한 일반화 성능을 입증했습니다.

시각적 필사본 특징을 이용한 역사적 필사본의 확률적 연대 측정

본 논문은 시각적 특징만을 사용하여 역사적 필사본 페이지의 연대를 확률적으로 추정하는 접근 방식을 제안합니다. 기존 연구들이 수 세기 단위로 분류하는 것과 달리, 본 모델은 연속적인 연도 축에 걸쳐 증거 기반 딥 회귀 문제(evidential deep regression)를 정의하여 예측 분포 전체를 출력합니다. EfficientNet-B2 백본과 Normal-Inverse-Gamma (NIG) 출력 헤드를 결합한 이 아키텍처는 단일 순방향 패스에서 분해된 우연성 및 인식론적 불확실성을 제공하며, 기존 방법들보다 훨씬 낮은 비용으로 높은 정확도와 최상의 보정 성능(PICP=92.6%)을 달성했습니다.

PrefixGuard: From LLM-Agent Traces to Online Failure-Warning Monitors

PrefixGuard는 LLM 에이전트의 긴 도구 사용 작업에서 발생하는 온라인 실패를 감지하기 위한 트레이스-모니터 프레임워크입니다. 이 시스템은 오프라인 StepView 유도 단계를 통해 결정론적 타입 스텝 어댑터를 학습하고, 모니터가 이벤트 추상화 및 프록시 리스크 점수자를 학습하여 실시간으로 에이전트의 잠재적 실패를 경고합니다. 실험 결과에 따르면 PrefixGuard는 다양한 벤치마크에서 높은 AUPRC(Area Under the Precision-Recall Curve) 성능을 보여주며, 기존 방법론 대비 상당한 개선을 입증했습니다.

LLM 해석 가능성을 위한 패치 효과 그래프 커널

본 논문은 LLM의 작동 방식을 해석하는 메커니즘적 해석(Mechanistic Interpretability) 분야에서 발생하는 고차원적이고 비정형적인 활성화 패치 데이터를 체계적으로 비교하고 분석할 수 있는 새로운 프레임워크를 제안합니다. 이 프레임워크는 활성화-패칭 프로파일을 모델 구성 요소에 대한 '패치 효과 그래프(patch-effect graphs)'로 재구성하여, 이를 그래프 커널 기법으로 분석합니다. 실험 결과, 이러한 그래프 구조가 차별적인 구조적 신호를 보존하며, 특히 국소화된 엣지-슬롯 특징이 높은 분류 정확도를 보여주어 LLM의 인과 회로를 비교하고 평가하는 강력한 방법을 제시합니다.

Q-MMR: 재귀적 재가중 및 모멘트 매칭을 통한 오프라인 평가

Q-MMR은 유한 시간 지평 MDP(Markov Decision Process)에서 오프라인 정책 평가를 위한 새로운 이론적 프레임워크입니다. 이 방법은 각 데이터 포인트에 대한 스칼라 가중치를 학습하여, 재가중된 보상이 목표 정책 하에서의 기대 수익을 근사하도록 합니다. 특히, 일반적인 함수 근사에 대해 $Q^ ext{target}$의 실현 가능성만으로 차원과 무관한(dimension-free) 유한 표본 크기 보장을 제시했다는 점이 중요합니다.

이 피드 구독하기

RSSFeedly, Inoreader 등으로 구독

API/api/search?q=검색어

AIllms.txt로 AI 크롤링 가이드

본 페이지의 콘텐츠는 AI가 공개된 소스를 기반으로 자동 수집·요약·번역한 것입니다. 원 저작권은 각 원저작자에게 있으며, 각 게시물의 “원문 바로가기” 링크를 통해 원문을 확인할 수 있습니다. 저작권자의 삭제 요청이 있을 경우 신속히 조치합니다.