Insights
AI가 자동으로 큐레이션·번역·정리하는 기술 동향 피드입니다.
arXiv cs.AI 2159건필터 해제
Sibyl-AutoResearch: 자율 연구는 논문 생성기가 아닌 스스로 진화하는 시행착오 하네스(Harnesses)를 필요로 한다
Sibyl-AutoResearch는 단순한 논문 생성을 넘어, 시행착오를 통해 스스로 진화하는 자율 연구 프레임워크를 제안합니다. 에이전트가 실험 결과와 실패를 학습하여 계획, 검증, 작성 단계에 반영하는 '과학적 시행착오 하네스' 메커니즘을 핵심으로 합니다.
4D-GSW: 4D Gaussian Splatting을 위한 운동학 인지형 시공간 일관 워터마킹
4D Gaussian Splatting 자산의 지적 재산권 보호를 위한 운동학 인지형 워터마킹 프레임워크인 4D-GSW를 제안합니다. 기존 기술의 시간적 깜빡임 문제를 해결하기 위해 시공간 곡률(STC) 지표와 HMM-MRF 에너지 최소화 모델을 도입하여 물리적 일관성을 유지합니다.
Bernini: 비디오 확산 (Video Diffusion)을 위한 잠재 의미론적 계획 (Latent Semantic Planning)
Bernini는 MLLM의 의미론적 계획 능력과 확산 모델의 렌더링 능력을 결합한 비디오 생성 및 편집 프레임워크입니다. MLLM이 ViT 임베딩 공간에서 목표 표현을 예측하면, DiT 기반 렌더러가 이를 바탕으로 픽셀을 합성하는 구조를 가집니다.
Meta-Soft: 문맥 보존형 KV Cache 압축을 위한 결합 가능한 Meta-Tokens 활용
LLM의 긴 문맥 처리 시 발생하는 KV 캐시 메모리 문제를 해결하기 위해 동적 압축 프레임워크인 Meta-Soft를 제안합니다. 입력 프롬프트에 맞춰 Soft Tokens를 동적으로 합성하고, 제거된 정보의 의미를 유지된 토큰에 재분배하여 정보 손실을 최소화합니다.
TransitLM: 지도 없이 대중교통 경로를 생성하기 위한 대규모 데이터셋 및 벤치마크
지도 인프라 없이 대중교통 경로를 생성할 수 있는 대규모 데이터셋 및 벤치마크인 TransitLM을 소개합니다. 중국 4개 도시의 1,300만 개 이상의 경로 기록을 포함하며, LLM이 지도 없이도 GPS 좌표를 정류장에 암묵적으로 접지하여 경로를 생성할 수 있음을 입증했습니다.
VEELA: CT 혈관 조영술 내 간 혈관 분할을 위한 임상적 제약 기반 벤치마크
VEELA는 CT 혈관 조영술에서 간 및 문맥 혈관을 정확히 분할하기 위해 설계된 임상 제약 기반 벤치마크 데이터셋입니다. 전문가의 엄격한 가시성 기반 주석을 통해 해부학적 변이성과 영상 불확실성을 반영하며, 다각도 평가 지표를 포함한 표준화된 프레임워크를 제공합니다.
Nash 통합 다중 에이전트 강화학습을 통한 인센티브 정렬형 차량 간(V2V) 에너지 거래
본 논문은 전기차(EV) 간의 효율적이고 공정한 에너지 거래를 위해 Nash 협상 솔루션을 MADDPG에 통합한 Nash-MADDPG 알고리즘을 제안합니다. 실험 결과, 기존 이중 경매 방식보다 사회적 후생과 거래량, 공정성 측면에서 크게 향상된 성능을 보였습니다.
TimeGuard: 시계열 예측 (TSF)에서의 백도어 방어를 위한 채널별 풀 트레이닝 (Channel-wise Pool Training)
시계열 예측(TSF) 모델의 백도어 공격 취약성을 분석하고, 이를 방어하기 위한 새로운 기법인 TimeGuard를 제안합니다. 데이터 얽힘과 작업 구성 변화 문제를 해결하기 위해 채널별 풀 트레이닝과 거리 정규화된 손실 선택 방식을 도입했습니다.
불확실한 도메인에서의 관찰 인지 계획 (Observation-aware Planning) 확장
불확실한 도메인에서 에이전트의 센싱 능력을 최적화하는 관찰 인지 계획(Observation-aware Planning) 연구를 소개합니다. POMDP 모델을 기반으로 센서 선택 및 위치 관측 가능성 문제를 해결하기 위한 새로운 (부)기호적 기법을 제안합니다.
VeriScale: 검증 가능한 코드 생성 (Verifiable Code Generation)을 위한 적대적 테스트 스위트 확장
LLM의 코드 생성 능력을 정확히 평가하기 위해 적대적 테스트 스위트 확장 프레임워크인 VeriScale을 제안합니다. 기존 벤치마크의 한계를 극복하여 모델의 취약점을 드러내는 VerinaPlus와 효율적인 VerinaLite을 구축했습니다.
시간적 비동기 정렬 대조 학습에 기반한 피험자 간 EEG 감정 인식
EEG 기반 감정 인식을 위해 시간적 비동기 정렬 대조 학습(TA2CL) 프레임워크를 제안합니다. ColBERT의 후기 상호작용 메커니즘을 응용하여 피험자 간의 시간적 불일치 문제를 해결하고 국소적 매칭을 통해 인식 성능을 높였습니다.
Epicure: 식품 성분 임베딩 (Food Ingredient Embeddings)의 창발적 기하학 탐색
다국어 레시피 코퍼스를 활용해 개발된 새로운 성분 임베딩 모델 제품군인 Epicure를 소개합니다. LLM을 통해 정규화된 데이터를 바탕으로 Cooc, Chem, Core라는 세 가지 Metapath2Vec 변형 모델을 제안합니다.
DeferMem: 강화학습을 통한 쿼리 시점의 증거 증류 기반 장기 기억 질의응답 (Long-Term Memory QA)
LLM 에이전트의 장기 기억 질의응답 문제를 해결하기 위해 강화학습 기반의 DeferMem 프레임워크를 제안합니다. 쿼리 시점에 증거를 증류하는 DistillPO 방식을 통해 노이즈를 제거하고 높은 정확도와 효율성을 동시에 달성했습니다.
공간적으로 근거가 제시된 병변 증거를 통한 임상적 해석이 가능한 안과용 VQA를 향하여
안과용 VQA의 임상적 해석 가능성을 높이기 위해 공간적 병변 근거를 포함하는 새로운 벤치마크 FundusGround를 제안합니다. ETDRS 그리드를 활용해 병변 위치를 표준화하고, 다양한 질문 형식을 통해 모델의 추론 능력을 검증합니다.
도시 장면 재구성을 위한 확산 모델 기반의 일반화 가능한 인핸서 (Diffusion-guided Generalizable Enhancer
GenRe는 확산 모델을 활용하여 도시 장면 재구성 시 발생하는 시점 변화 문제를 해결하는 일반화 가능한 인핸서입니다. 기존 방식의 장면별 최적화 비용과 일반화 한계를 극복하여, 미학습 시점에서도 고품질의 3D 가우시안 표현을 효율적으로 생성합니다.
단일 펄스 전자기 결함 주입(EMFI) 하에서의 Intel Neural Compute Stick 2 결함 응답 특성 분석
Intel Neural Compute Stick 2(NCS2)를 대상으로 단일 펄스 전자기 결함 주입(EMFI) 실험을 수행하여 하드웨어 결함 응답을 분석한 연구입니다. 실험 결과, 정확도 변화 없음부터 장치 멈춤까지 네 가지의 재현 가능한 결과 클래스를 확인했습니다.
FastTab: 작은 재귀 모듈과 1D Transformer를 이용한 빠른 표 인식기
FastTab은 경량 Tiny Recursive Module과 1D Transformer를 결합하여 표 구조를 빠르게 인식하는 모델입니다. 자기회귀적 디코딩 없이 그리드 중심으로 작동하여 낮은 지연 시간과 높은 성능을 동시에 달성했습니다.
Pre-VLA: 신뢰할 수 있는 Vision-Language-Action 및 World-Model Rollout을 위한 선제적 런타임 검증
VLA 모델과 World Model의 액션 생성 불확실성을 해결하기 위해 선제적 런타임 검증 아키텍처인 Pre-VLA를 제안합니다. 물리적 실행 전 액션의 안전 신뢰도와 이점 점수를 예측하여 저품질 액션을 필터링하고 성공률을 높입니다.
마이크로컨트롤러 상의 활성화 함수를 위한 상수 시간 (Constant-Time) 구현 방법론
임베디드 마이크로컨트롤러 환경에서 활성화 함수의 타이밍 부채널 공격을 방어하기 위한 상수 시간 구현 방법론을 제안합니다. ARM Cortex-M4 플랫폼에서 다양한 함수를 대상으로 분기 없는 선택과 Padé 근사 등을 적용하여 보안성과 정확도를 동시에 검증했습니다.
S2ED: 일관성 인지 스토리 삽화를 위한 스토리에서 실행 가능한 설명으로의 변환
S2ED는 다중 프레임 스토리 삽화의 일관성을 유지하기 위해 스토리를 실행 가능한 설명 시퀀스로 변환하는 프레임워크입니다. 별도의 학습 없이 세 가지 에이전트를 통해 캐릭터 정체성과 공간적/정서적 단서를 관리하여 장기적 일관성을 확보합니다.
이 피드 구독하기
본 페이지의 콘텐츠는 AI가 공개된 소스를 기반으로 자동 수집·요약·번역한 것입니다. 원 저작권은 각 원저작자에게 있으며, 각 게시물의 “원문 바로가기” 링크를 통해 원문을 확인할 수 있습니다. 저작권자의 삭제 요청이 있을 경우 신속히 조치합니다.