Insights
AI가 자동으로 큐레이션·번역·정리하는 기술 동향 피드입니다.
arXiv cs.AI 1943건필터 해제
GUI 에이전트를 위한 기술 가이드 기반 연속 증류 (Skill-Guided Continuation Distillation)
GUI 에이전트의 오프-궤적 상태 문제를 해결하기 위해 기술 가이드 기반 연속 증류(SGCD) 프레임워크를 제안합니다. SGCD는 전문가 궤적을 벗어난 상태에서도 성공적인 연속 실행을 생성하여 정책의 감독 격차를 해소합니다. OSWorld-Verified 벤치마크에서 모델의 성공률을 30%대에서 50% 이상으로 크게 향상시켰습니다.
SAERec: Sparse Autoencoder를 통한 추천을 위한 세밀하고 해석 가능한 의도 사전 구축
SAERec는 Sparse Autoencoder(SAE)를 활용하여 LLM의 잠재 공간에서 세밀하고 해석 가능한 의도 사전(intent priors)을 구축하는 새로운 추천 모델입니다. 텍스트 임베딩을 얽힘 해제하여 개인적·공통 의도를 추출하고, 멀티 브랜치 어텐션 메커니즘을 통해 추천의 정확도와 해석 가능성을 동시에 높였습니다.
TransitNet: 낮은 SNR의 트랜싯 블라인드 탐색을 위한 컴팩트한 어텐션 증강 딥러닝 프레임워크
낮은 신호 대 잡음비(low-SNR) 환경에서 지구 크기 행성을 탐색하기 위한 어텐션 증강 딥러닝 프레임워크 TransitNet을 제안합니다. 기존 TLS 및 BLS 알고리즘보다 높은 정확도와 회복률을 보이며, 매우 컴팩트한 모델 크기로 높은 추론 효율성을 제공합니다.
RTSGameBench: 시각-언어 모델(VLMs)의 전략적 추론을 위한 RTS 벤치마크
시각-언어 모델(VLMs)의 전략적 추론 능력을 평가하기 위한 새로운 RTS 벤치마크인 RTSGameBench를 제안합니다. Beyond All Reason 게임을 기반으로 다양한 매치업과 자기 진화형 생성 프레임워크를 통해 모델의 한계를 체계적으로 진단합니다.
SciRisk-Bench: AI4Science 안전성을 위한 위험 차원 인식 벤치마크
AI4Science 워크플로우의 안전성을 평가하기 위해 설계된 새로운 벤치마크인 SciRisk-Bench를 소개합니다. 이 벤치마크는 7개 학문 분야와 10개의 위험 차원을 통해 LLM의 과학적 위험 인식 능력을 정밀하게 진단합니다.
뇌 MRI를 위한 양자 잠재 GAN 증강(Quantum-Latent GAN Augmentation)의 통제된 벤치마크
뇌 MRI 증강을 위한 양자 잠재 GAN의 효용성을 검증하기 위해 파라미터 수를 통제한 벤치마크를 제시합니다. 실험 결과, 양자 생성기는 고전적 생성기와 통계적으로 차이가 없었으며, 데이터 부족 상황에서 유의미한 성능 향상을 보이지 못했습니다.
ThinkDeception: 해석 가능한 멀티모달 기만 탐지를 위한 점진적 강화학습 프레임워크
ThinkDeception은 해석 가능한 멀티모달 기만 탐지를 위한 새로운 프레임워크를 제안합니다. MLLM과 점진적 강화학습(VAC-GRPO)을 활용하여 모달 간 불일치를 포착하고, 단계별 사고의 사슬(CoT)을 통해 투명한 추론 과정을 제공합니다.
TRAP: 작업 완료 능력 및 능동적 개인정보 추출 저항성 벤치마크
에이전트의 작업 수행 능력과 개인정보 보호 사이의 트레이드오프를 평가하는 새로운 벤치마크인 TRAP을 소개합니다. 연구 결과, 기존의 프롬프트 기반 방어는 작업 정확도를 저하시키며 소프트맥스 기반 모델에서는 두 목표를 동시에 달성하기 어렵다는 불가능성 결과를 입증했습니다.
Spotlight: DiT RL 사후 학습을 위한 시드 탐색(Seed Exploration)과 스팟 GPU(Spot GPUs)의 시너지 활용
DiT RL 사후 학습의 비용 문제를 해결하기 위해 스팟 GPU와 시드 탐색을 결합한 시스템 Spotlight를 제안합니다. 오래된 가중치를 활용한 탐색과 탄력적 시퀀스 병렬성(SP) 재구성을 통해 학습 효율을 극대화합니다.
FoMoE: MoE 연합을 통한 풀-레플리카(Full-Replica) 장벽 돌파
FoMoE는 MoE 아키텍처 학습 시 모든 사이트에 모델 전체 복제본이 필요했던 기존 방식의 메모리 및 통신 한계를 극복하는 연구입니다. 전문가 레이어를 워커 간에 분할하여 통신 비용을 획기적으로 줄이고 처리량을 향상시킵니다.
HRRR 예측 오차 예측을 위한 하이브리드 LSTM-Vision Transformer 아키텍처
HRRR 수치 예보 모델의 오차를 예측하기 위해 LSTM과 Vision Transformer를 결합한 하이브리드 LSTM-ViT 아키텍처를 제안합니다. 대기 프로파일의 수직 구조 정보를 통합하여 기존 LSTM 대비 강수량 예측 오차 성능을 약 2배 향상시켰습니다.
RODS: 멀티턴 도구 사용 에이전트를 위한 보상 기반 온라인 데이터 합성
멀티턴 도구 사용 에이전트 학습 시 발생하는 데이터 고갈 문제를 해결하기 위해 RODS를 제안합니다. RODS는 보상 분산을 활용해 에이전트의 능력 경계에 있는 샘플을 식별하고, 이를 바탕으로 새로운 데이터를 동적으로 합성하여 학습 효율을 극대화합니다.
ARIADNE: 추론 시 어댑터 동적 선택을 위한 비인지적 라우팅 (Agnostic Routing for Inference-time
ARIADNE은 추론 시 레이블 없이도 가장 적합한 PEFT 어댑터를 자동으로 선택하는 비인지적 라우팅 프레임워크입니다. 어댑터 내부 정보나 추가 학습 없이 입력 임베딩의 중심점과의 근접성을 측정하여 동작하며, 높은 확장성과 호환성을 제공합니다.
ProductConsistency: SFT 및 RL을 통한 지시어 기반 이미지 편집에서의 제품 정체성 보존 개선
지시어 기반 이미지 편집 시 제품의 정체성과 브랜딩을 보존하기 위한 새로운 연구를 소개합니다. SFT와 RL을 활용한 ProductConsistency 데이터셋과 벤치마크를 통해 Qwen 및 Flux 모델의 제품 일관성과 텍스트 렌더링 성능을 크게 개선했습니다.
에이전트 우선 웹을 향하여: AI 에이전트를 위한 웹의 재설계
인간 중심의 기존 웹 구조를 AI 에이전트 친화적으로 재설계하기 위한 원칙적 프레임워크를 제안합니다. 액세스, 경제, 콘텐츠의 세 가지 계층에서 에이전트가 일급 시민으로서 기능할 수 있는 새로운 웹 아키텍처를 다룹니다.
XAI를 이용한 유럽 전력 시장의 동인 및 상호 의존성 분석
본 논문은 DNN과 XAI 기술을 결합하여 유럽 전력 시장의 복잡한 가격 결정 요인을 분석합니다. SHAP과 SSHAP을 활용해 재생 에너지와 가스 가격, 국가 간 상호 연결성이 전력 가격에 미치는 영향을 정량적으로 규명합니다.
LLM 에이전트 통신 프로토콜의 기술적 분류 체계
멀티 에이전트 시스템의 상호 운용성 문제를 해결하기 위해 LLM 에이전트 통신 프로토콜의 기술적 분류 체계를 제안합니다. 9개의 오픈 소스 프로토콜을 분석하여 5가지 차원의 분류 프레임워크를 구축하고 향후 발전 방향을 제시합니다.
등변 그래프 신경망 (Equivariant Graph Neural Networks)을 통한 재료 스크리닝용 광학 스펙트럼 예측 성능 향상
등변 그래프 신경망(Equivariant GNN)을 활용하여 재료의 광학 스펙트럼 예측 성능을 높이는 연구를 소개합니다. GotenNet을 적응시켜 RPA 수준의 대규모 데이터셋에서 기존 모델보다 뛰어난 예측 정확도를 입증했습니다.
보상 머신(Reward Machines)을 이용한 파레토 Q-러닝 (Pareto Q-Learning with Reward Machines)
보상 머신(Reward Machines)을 활용하여 다중 목적 강화학습의 효율성을 높인 PQLRM 알고리즘을 제안합니다. 이 알고리즘은 파레토 프런트를 근사하는 PQL과 보상 구조를 활용하는 QRM을 결합하여 비마르코프적 환경에서도 높은 샘플 효율성을 보여줍니다.
OrthoReg: 하이브리드 심볼릭-뉴럴 동역학 시스템을 위한 직교 정규화 (Orthogonal Regularization)
심볼릭 물리 모델과 뉴럴 네트워크를 결합한 하이브리드 동역학 시스템 모델링에서 발생하는 중복 문제를 해결하는 OrthoReg 기법을 제안합니다. 직교 정규화를 통해 심볼릭 구성 요소와 뉴럴 잔차 간의 상호 보완적 분해를 유도하여 모델의 해석력과 일반화 성능을 높입니다.
이 피드 구독하기
본 페이지의 콘텐츠는 AI가 공개된 소스를 기반으로 자동 수집·요약·번역한 것입니다. 원 저작권은 각 원저작자에게 있으며, 각 게시물의 “원문 바로가기” 링크를 통해 원문을 확인할 수 있습니다. 저작권자의 삭제 요청이 있을 경우 신속히 조치합니다.