Insights
AI가 자동으로 큐레이션·번역·정리하는 기술 동향 피드입니다.
arXiv cs.AI 2086건필터 해제
압축으로서의 사고: 당신의 추론 모델은 사실 컨텍스트 압축기입니다
본 연구는 사고 모델(thinking model)이 긴 컨텍스트를 자연스럽게 압축할 수 있다는 '압축으로서의 사고(TaC)' 패러다임을 제안합니다. 별도의 압축 모듈 없이 사고 흔적을 활용하며, 제약 조건이 추가된 TaC-C 모델은 기존 압축 방식보다 뛰어난 성능을 입증했습니다.
IPO-Mine: 길고 멀티모달(Multimodal)인 IPO 문서의 섹션 구조 분석을 위한 툴킷 및 데이터셋
IPO 신고서의 복잡한 구조를 분석하기 위한 오픈 소스 프레임워크인 IPO-Toolkit과 대규모 멀티모달 데이터셋인 IPO-Dataset을 소개합니다. 10만 개 이상의 문서를 활용해 금융 문서 내 멀티모달 추론의 한계와 정렬 문제를 연구합니다.
OpenURMA: Unified Bus 프로토콜의 클린룸 오픈 구현
Huawei의 Unified Bus(UB) 사양을 기반으로 한 최초의 클린룸 오픈 구현체인 OpenURMA를 소개합니다. UB는 기존 RDMA의 PCIe 병목 현상을 해결하기 위해 연결 상태를 분리하고 네이티브 CPU 로드/스토어 방식을 채택하여 지연 시간을 획기적으로 단축합니다.
LiveBrowseComp: 검색 에이전트는 실제로 검색하는가, 아니면 이미 알고 있는 내용을 확인하는 것뿐인가?
LLM 검색 에이전트가 외부 검색보다 모델 내부 지식에 의존하는 '내재적 지식 의존성(IKD)' 문제를 분석합니다. 이를 평가하기 위해 최신 정보를 활용한 새로운 심층 검색 벤치마크인 LiveBrowseComp를 제안합니다.
에너지 보정(Energy Calibration)을 통한 멀티 어댑터 표현 개입 (Multi-Adapter Representation
모델 가중치를 수정하지 않고 LLM을 정렬하는 MARI 기법을 제안합니다. 에너지 보정 기반의 멀티 어댑터와 게이팅 모듈을 통해 샘플별로 최적화된 개입 방향과 강도를 결정하여 정렬 성능과 일반 능력을 동시에 향상시킵니다.
AlphaTransit: 도시 규모의 대중교통 노선 설계를 위한 학습 방법
AlphaTransit는 MCTS와 신경망 정책-가치 네트워크를 결합하여 도시 규모의 대중교통 노선 설계를 최적화하는 프레임워크입니다. 지연된 피드백 문제를 해결하기 위해 시뮬레이터 롤아웃 없이도 의사결정 시점의 앞서보기를 제공하며, 벤치마크 테스트에서 기존 방식보다 높은 서비스율을 달성했습니다.
MemTrace: 대규모 언어 모델(LLM) 메모리 시스템의 오류 추적 및 원인 규명
LLM 메모리 시스템의 오류 추적 및 원인 규명을 위한 새로운 프레임워크인 MemTrace를 제안합니다. 메모리 진화 그래프를 통해 정보 흐름을 추적하고, MemTraceBench를 통해 다양한 메모리 시스템의 실패 모드를 체계적으로 분석합니다.
제품 이미지 생성을 위한 유틸리티 인식 멀티모달 대조 학습 (Utility-Aware Multimodal Contrastive Learning)
소비자 수요를 반영하여 제품 이미지 생성 성능을 최적화하는 '유틸리티 인식 멀티모달 대조 학습' 프레임워크를 제안합니다. 기존 모델의 의미론적 정렬 한계를 넘어, 수요 중심의 시각적 단서를 학습함으로써 상업적 효과를 극대화합니다.
BIRDNet: 해석 가능한 심층 신경망으로서의 불리언 함의 지식 그래프 채굴 및 인코딩
BIRDNet은 정형 데이터에서 불리언 함의 관계(BIRs)를 채굴하여 지식 그래프를 형성하고, 이를 계층형 신경망의 구조로 인코딩하는 뉴로심볼릭 모델입니다. 외부 규칙 없이 데이터로부터 직접 구조적 사전 지식을 학습하며, 높은 해석 가능성과 파라미터 효율성을 동시에 제공합니다.
선호도 형상 기반 기대 하이퍼볼륨 및 R2 개선: 정확한 계산과 단조성
베이지안 다목적 최적화를 위한 선호도 형상 기반 기대 개선(EHVI) 기준을 연구합니다. 하이퍼볼륨과 R2 지표의 기하학적 구조를 분석하여 정확한 계산, 파레토 호환성, 단조성을 보존하는 변환 방식을 제안합니다.
Reverse Probing: 임상 텍스트 내 대규모 언어 모델을 위한 지도 학습 기반 토큰 수준 불확실성 정량화 (Uncertainty
임상 텍스트 요약 시 LLM의 토큰 수준 불확실성을 정량화하는 Reverse Probing 프레임워크를 제안합니다. 모델의 내부 활성화를 탐사하여 기존 방식보다 낮은 비용으로 높은 정확도의 불확실성 신호를 추출합니다.
CORE: 대조적 성찰(Contrastive Reflection)을 통한 추론 능력의 급격한 향상
CORE는 성공과 실패한 추론 흔적을 비교하여 자연어 통찰을 생성하는 비매개변수적 학습 알고리즘입니다. 기존 방식보다 적은 샘플과 롤아웃으로도 효율적인 모델 자기 개선을 가능하게 하며, 해석 가능한 지식을 압축적으로 저장합니다.
외삽적 가중치 평균(Extrapolative Weight Averaging)을 통한 코드 RL에서의 정확도-효율성
코드 강화학습(RL)에서 외삽적 가중치 평균(EWA)을 통해 정확도와 효율성 사이의 파레토 프런티어를 확장하는 방법을 연구합니다. 중첩된 유닛 테스트 커버리지를 활용하여 훈련된 체크포인트 너머의 성능을 확보할 수 있음을 입증했습니다.
CubePart: 개방형 어휘(Open-Vocabulary) 기반의 부품 제어 가능 3D 생성 모델
CubePart는 사용자가 정의한 부품 스키마에 따라 제어 가능한 3D 메쉬를 생성하는 새로운 프레임워크입니다. 전역 형상 합성 및 부품 수준 디코딩의 2단계 아키텍처를 통해 게임 엔진에서 즉시 사용 가능한 의미론적 부품 구조를 생성합니다.
SwarmHarness: 분산형 인센티브 정렬 AI 에이전트 네트워크를 통한 기술 기반 작업 라우팅 (Skill-Based Task
SwarmHarness는 분산형 에이전트 네트워크를 통해 복잡한 작업을 효율적으로 분배하는 새로운 프레임워크를 제안합니다. 에이전트의 전문 기술을 기반으로 작업을 라우팅하며, 게임 이론적 인센티브 구조를 통해 시스템 전체의 목표를 달성합니다.
지속적으로 진화하는 연결성으로서의 메모리 재고찰
정적인 저장소 방식의 한계를 극복하기 위해 메모리를 이질적 그래프로 모델링한 FluxMem 프레임워크를 제안합니다. 초기 연결부터 피드백 기반 정제, 장기적 통합 과정을 통해 메모리 토폴로지를 동적으로 진화시킵니다. LoCoMo, Mind2Web 등 다양한 벤치마크에서 SOTA 성능을 기록하며 뛰어난 적응력을 입증했습니다.
에이전트에게 의미론적 메타데이터가 필요한가? 에이전트 기반 데이터 검색에 관한 비교 연구
자율 에이전트의 데이터 검색 시 의미론적 메타데이터의 효용성을 비교 연구했습니다. 실험 결과, schema.org를 활용한 의미론적 에이전트가 비정형 웹을 탐색하는 베이스라인 에이전트보다 데이터 정밀도와 실행 가능성 측면에서 압도적으로 높은 성능을 보였습니다.
LLM 추론을 위한 기술 조건부 게이트형 자기 증류 (Skill-Conditioned Gated Self-Distillation)
LLM의 추론 능력을 향상시키기 위해 기술 뱅크를 활용하는 새로운 자기 증류(Self-Distillation) 기법인 SGSD를 제안합니다. 교사의 가설을 검증하고 불확실한 신호를 억제하는 게이트 목적 함수를 통해 수학적 추론 성능을 효과적으로 높였습니다.
약점으로부터 배우기: 소형 컴퓨터 사용 에이전트(Computer-Use Agents)를 위한 자동화된 도메인 특화 기술
소형 컴퓨터 사용 에이전트(CUA)의 도메인 특화 성능을 높이기 위한 새로운 프레임워크 LearnWeak를 소개합니다. 이 방식은 학생 모델의 약점을 식별하여 타겟팅된 데이터를 합성하고, 계획 및 실행 오류를 분리하여 학습하는 오류 인식 목적 함수를 사용합니다.
CaMBRAIN: 인과적 상태 공간 모델 (Causal State Space Models)을 이용한 실시간 연속 EEG 추론
CaMBRAIN은 EEG 신호의 인과적 특성을 반영한 최초의 Mamba 기반 상태 공간 모델(SSM)입니다. 기존 어텐션 모델의 이차적 스케일링 문제를 해결하고, 다단계 자기지도 학습을 통해 실시간 연속 추론과 장기 문맥 유지를 가능하게 합니다.
이 피드 구독하기
본 페이지의 콘텐츠는 AI가 공개된 소스를 기반으로 자동 수집·요약·번역한 것입니다. 원 저작권은 각 원저작자에게 있으며, 각 게시물의 “원문 바로가기” 링크를 통해 원문을 확인할 수 있습니다. 저작권자의 삭제 요청이 있을 경우 신속히 조치합니다.