Insights
AI가 자동으로 큐레이션·번역·정리하는 기술 동향 피드입니다.
arXiv cs.AI 2012건필터 해제
일대다 시공간적 근거 제시(One-to-Many Temporal Grounding)를 향하여
하나의 텍스트 질의에 대해 여러 비디오 세그먼트를 찾아내는 '일대다 시공간적 근거 제시(OMTG)' 연구를 소개합니다. 새로운 벤치마크와 데이터셋을 구축하고, CoT 추론을 활용한 보상 함수를 통해 기존 MLLM의 한계를 극복했습니다.
제약 최적화에서의 서브스페이스 프리컨디셔닝(Subspace Preconditioning)을 위한 Multi-ResNets
제약 최적화 문제를 해결하기 위한 새로운 단계별 잔차 신경망 아키텍처인 MResOpt를 제안합니다. 예측-완료-수정 파이프라인을 통해 제약 조건을 우선순위에 따라 분해하여 처리하며, 다양한 벤치마크와 전력 계통 최적화 문제에서 높은 성능을 입증했습니다.
LLM 자기 인식: 활성화 시그니처 (Activation Signatures)의 제어 및 검색
LLM이 생성한 텍스트 내에 모델 고유의 '자기 인식 시그니처'를 암묵적으로 인코딩할 수 있음을 입증한 연구입니다. 잔차 스트림 제어를 통해 텍스트 품질 저하 없이 98% 이상의 높은 정확도로 모델을 식별할 수 있는 메커니즘을 제안합니다.
메모리 증강 신경망 (Memory-Augmented Neural Networks)을 이용한 AIS 기반 선박 궤적 예측
메모리 증강 신경망(MANN)을 활용하여 AIS 데이터를 기반으로 선박의 궤적을 예측하는 연구를 다룹니다. 외부 메모리 활용을 통해 기존 딥러닝 모델보다 향상된 예측 성능을 입증했습니다.
양자 강화 희귀 사건 발견 및 샘플링
희귀 사건을 사전에 학습하지 않고도 효율적으로 발견하고 샘플링할 수 있는 새로운 양자 알고리즘을 제안합니다. 이 알고리즘은 희귀성 임계값에 대해 최적의 양자 스케일링을 달성하며, 헤비 테일 시스템에서 이차적 가속을 입증했습니다.
TokenMizer: 장기적 LLM 컨텍스트 관리를 위한 그래프 구조 세션 메모리
TokenMizer는 LLM의 유한한 컨텍스트 창 문제를 해결하기 위해 세션 히스토리를 지식 그래프로 모델링하는 오픈 소스 프록시 시스템입니다. 기존의 평면적 텍스트 방식과 달리 관계적 구조를 보존하며, 압축된 재개 블록을 통해 토큰 효율성과 결정 재현율을 동시에 높입니다.
DragOn: 드래그 기반 GUI 상호작용을 위한 벤치마크 및 데이터셋
GUI 에이전트의 드래그 기반 상호작용 능력을 향상시키기 위한 새로운 벤치마크 및 데이터셋인 DragOn을 소개합니다. 텍스트 하이라이트, 셀 선택 등 4가지 도메인을 포함하며, 대규모 데이터셋을 통해 모델의 컴퓨터 사용 능력을 개선합니다.
F3-Tokenizer: 이해와 생성을 위한 오디오 오토인코더 잠재 변수(Latents) 제어
F3-Tokenizer는 오디오의 이해와 생성을 동시에 지원하기 위해 설계된 새로운 오디오 토크나이저입니다. 노이즈 정규화 병목 구간과 표현 인코더를 결합하여, 재구성이 가능한 연속적 잠재 변수와 의미론적 고차원 표현을 모두 확보합니다.
지식은 어디로 유입되어야 하는가? 멀티모달 반복 생성 모델(Multimodal Iterative Generative Models)의 지식
멀티모달 생성 모델의 지식 주입 문제를 해결하기 위해 개입 계층(intervention-layer) 관점의 새로운 프레임워크를 제안합니다. 생성 과정을 입력/출력, 전이 함수, 중간 상태, 파라미터의 네 가지 계층으로 분류하여 지식 주입의 구조적 접근법을 제시합니다.
대규모 언어 모델 (LLM) 의사결정에 기반한 감염병 확산 시뮬레이션
LLM의 의사결정 능력을 활용하여 감염병 확산 시뮬레이션 프레임워크를 구축한 연구입니다. 인구 조사 기반의 합성 에이전트와 공간 데이터를 결합하여 개인의 행동 역학을 모델링하고, 다양한 시나리오를 통해 사회적·지리적 요인의 영향을 분석했습니다.
EasyLens: 의료용 시각-언어 모델(VLM)을 위한 학습이 필요 없는 플러그 앤 플레이 방식의 미세 병변 표현 증폭기
EasyLens는 의료용 시각-언어 모델(VLM)이 미세한 병변을 더 잘 인식하도록 돕는 학습이 필요 없는 플러그 앤 플레이 방식의 증폭기입니다. EasyBank와 EasyTag, EasyAmplifier를 통해 추가 학습 없이도 병변 관련 시각적 단서를 강화하여 탐지 성능을 높입니다.
LatentWave: 무선 파운데이션 모델을 위한 JEPA 사전 학습
LatentWave는 JEPA 아키텍처를 활용하여 무선 신호의 저수준 세부 사항에 편향되지 않는 무선 파운데이션 모델을 제안합니다. 잠재 공간 내 예측을 통해 다양한 무선 작업에 즉시 전이 가능한 표현을 학습하며, 가변적인 안테나 환경에서도 유연하게 작동합니다.
의식 있는 AI를 위한 접근 방식으로서의 창발적 언어 (Emergent Language)
인공 시스템의 의식 연구를 위해 다중 에이전트 강화학습 기반의 창발적 언어(EL) 방법론을 제안합니다. 인간 언어의 사전 지식을 배제하고 과업 압박을 통해 에이전트가 스스로 통신 구조를 발전시키는 생성적 접근 방식을 다룹니다.
HomeWorld: 제어 가능하고 밀도 있게 상호작용하는 전체 주거 공간 장면 생성을 위한 통합 평면도-가구 배치 프레임워크
HomeWorld는 전체 주거 공간의 평면도 생성부터 가구 및 소형 객체 배치까지 통합하는 계층적 프레임워크를 제안합니다. LLM과 VLM, 3D 생성 모델을 결합하여 시뮬레이션이 가능한 사실적인 실내 장면을 생성합니다.
Humans' ALMANAC: 에이전트 협업을 위한 행동 수준의 멘탈 모델 주석이 포함된 인간 협업 데이터셋
에이전트의 협업 역량을 강화하기 위해 인간의 행동 수준 멘탈 모델 주석이 포함된 ALMANAC 데이터셋을 제안합니다. 이 데이터셋은 자기 추론, 파트너 의도, 팀 목표를 포함하며 LLM의 협업 행동 및 멘탈 모델 예측 능력을 평가하는 데 유용합니다.
RiskFlow: 빠르고 충실한 안전 필수 교통 시나리오 생성
RiskFlow는 자율 주행 시스템 평가를 위한 안전 필수 교통 시나리오 생성 프레임워크입니다. 기존 확산 모델의 높은 계산 비용과 누적 오류 문제를 해결하기 위해, 단 한 번의 순방향 패스로 안정적인 궤적을 생성하는 방식을 제안합니다.
이미지 차이 분류 (Image Difference Classification)로서의 인프라 점검 재고: 교통 표지판 사례 연구
디지털 트윈 기반 도로 인프라 점검 시 발생하는 데이터 부족 문제를 해결하기 위해, 결함 탐지를 이미지 차이 분류(IDC)로 재정의하는 연구를 제안합니다. 교통 표지판 사례 연구 결과, 지시 기반 분류기가 인코더 기반 모델보다 우수한 성능을 보였습니다.
에이전트가 스스로 물러날 것인가? In-Band Access-Deny 신호를 통한 LLM-Agent 준수 여부 측정
LLM 에이전트가 인프라 운영 시 특정 리소스 접근을 자발적으로 피하도록 유도하는 '기피 신호(Recuse Signal)' 개념을 제안합니다. SSH 및 PostgreSQL 환경에서 실험한 결과, GPT-4o와 Claude Code 등 주요 모델들이 이 신호를 인지하고 작업을 중단하는 높은 준수율을 보였습니다.
에이전트 메모리: 상태 유지형 장기 작업(Stateful Long-Horizon Workloads)의 특성 분석 및 시스템적 시사점
LLM 에이전트의 장기 작업을 위한 메모리 시스템의 동작을 분석한 최초의 시스템 특성 분석 연구입니다. 에이전트 메모리 분류 체계를 제안하고, 구축·검색·생성 비용을 프로파일링하여 설계 선택이 시스템 성능에 미치는 영향을 규명합니다.
Vortex: AI 에이전트를 위한 효율적이고 프로그래밍 가능한 희소 어텐션 (Sparse Attention) 서빙
Vortex는 AI 에이전트와 연구자가 희소 어텐션(Sparse Attention) 알고리즘을 신속하게 프로토타이핑하고 배포할 수 있도록 돕는 시스템입니다. 페이지 중심 텐서 추상화와 Python 프론트엔드를 결합하여 이론적 효율성을 실제 처리량 개선으로 연결합니다.
이 피드 구독하기
본 페이지의 콘텐츠는 AI가 공개된 소스를 기반으로 자동 수집·요약·번역한 것입니다. 원 저작권은 각 원저작자에게 있으며, 각 게시물의 “원문 바로가기” 링크를 통해 원문을 확인할 수 있습니다. 저작권자의 삭제 요청이 있을 경우 신속히 조치합니다.