Insights
AI가 자동으로 큐레이션·번역·정리하는 기술 동향 피드입니다.
arXiv cs.AI 2012건필터 해제
RODS: 멀티턴 도구 사용 에이전트를 위한 보상 기반 온라인 데이터 합성
멀티턴 도구 사용 에이전트 학습 시 발생하는 데이터 고갈 문제를 해결하기 위해 RODS를 제안합니다. RODS는 보상 분산을 활용해 에이전트의 능력 경계에 있는 샘플을 식별하고, 이를 바탕으로 새로운 데이터를 동적으로 합성하여 학습 효율을 극대화합니다.
ARIADNE: 추론 시 어댑터 동적 선택을 위한 비인지적 라우팅 (Agnostic Routing for Inference-time
ARIADNE은 추론 시 레이블 없이도 가장 적합한 PEFT 어댑터를 자동으로 선택하는 비인지적 라우팅 프레임워크입니다. 어댑터 내부 정보나 추가 학습 없이 입력 임베딩의 중심점과의 근접성을 측정하여 동작하며, 높은 확장성과 호환성을 제공합니다.
ProductConsistency: SFT 및 RL을 통한 지시어 기반 이미지 편집에서의 제품 정체성 보존 개선
지시어 기반 이미지 편집 시 제품의 정체성과 브랜딩을 보존하기 위한 새로운 연구를 소개합니다. SFT와 RL을 활용한 ProductConsistency 데이터셋과 벤치마크를 통해 Qwen 및 Flux 모델의 제품 일관성과 텍스트 렌더링 성능을 크게 개선했습니다.
에이전트 우선 웹을 향하여: AI 에이전트를 위한 웹의 재설계
인간 중심의 기존 웹 구조를 AI 에이전트 친화적으로 재설계하기 위한 원칙적 프레임워크를 제안합니다. 액세스, 경제, 콘텐츠의 세 가지 계층에서 에이전트가 일급 시민으로서 기능할 수 있는 새로운 웹 아키텍처를 다룹니다.
XAI를 이용한 유럽 전력 시장의 동인 및 상호 의존성 분석
본 논문은 DNN과 XAI 기술을 결합하여 유럽 전력 시장의 복잡한 가격 결정 요인을 분석합니다. SHAP과 SSHAP을 활용해 재생 에너지와 가스 가격, 국가 간 상호 연결성이 전력 가격에 미치는 영향을 정량적으로 규명합니다.
LLM 에이전트 통신 프로토콜의 기술적 분류 체계
멀티 에이전트 시스템의 상호 운용성 문제를 해결하기 위해 LLM 에이전트 통신 프로토콜의 기술적 분류 체계를 제안합니다. 9개의 오픈 소스 프로토콜을 분석하여 5가지 차원의 분류 프레임워크를 구축하고 향후 발전 방향을 제시합니다.
등변 그래프 신경망 (Equivariant Graph Neural Networks)을 통한 재료 스크리닝용 광학 스펙트럼 예측 성능 향상
등변 그래프 신경망(Equivariant GNN)을 활용하여 재료의 광학 스펙트럼 예측 성능을 높이는 연구를 소개합니다. GotenNet을 적응시켜 RPA 수준의 대규모 데이터셋에서 기존 모델보다 뛰어난 예측 정확도를 입증했습니다.
보상 머신(Reward Machines)을 이용한 파레토 Q-러닝 (Pareto Q-Learning with Reward Machines)
보상 머신(Reward Machines)을 활용하여 다중 목적 강화학습의 효율성을 높인 PQLRM 알고리즘을 제안합니다. 이 알고리즘은 파레토 프런트를 근사하는 PQL과 보상 구조를 활용하는 QRM을 결합하여 비마르코프적 환경에서도 높은 샘플 효율성을 보여줍니다.
OrthoReg: 하이브리드 심볼릭-뉴럴 동역학 시스템을 위한 직교 정규화 (Orthogonal Regularization)
심볼릭 물리 모델과 뉴럴 네트워크를 결합한 하이브리드 동역학 시스템 모델링에서 발생하는 중복 문제를 해결하는 OrthoReg 기법을 제안합니다. 직교 정규화를 통해 심볼릭 구성 요소와 뉴럴 잔차 간의 상호 보완적 분해를 유도하여 모델의 해석력과 일반화 성능을 높입니다.
AdsMind: 불균일 촉매 표면에서의 흡착 구성의 자기 교정적 발견을 위한 물리 기반 멀티 에이전트 시스템
AdsMind는 불균일 촉매 표면의 흡착 구성을 발견하기 위해 MLFF 피드백을 활용하는 폐쇄 루프 멀티 에이전트 프레임워크입니다. LLM 에이전트가 물리 기반 피드백을 통해 오류를 자율적으로 수정함으로써 높은 탐색 신뢰성을 제공합니다.
의료 애플리케이션에서의 조기 진단 인계 및 침묵하는 환각 완화를 위한 에이전트 기반 AI (Agentic AI) 프레임워크
의료 AI의 조기 진단 인계와 침묵하는 환각 문제를 해결하기 위한 멀티 에이전트 프레임워크를 제안합니다. 뉴로-심볼릭 상태 추적과 인식론적 불확실성 정량화 메커니즘을 통해 진단의 정확도와 안전성을 높였습니다.
LLM이 흉터를 분석할 때: 이미지에서 임상적으로 의미 있는 특징 추출까지
의료 영상 분류의 데이터 부족 문제를 해결하기 위해 LLM을 특징 엔지니어로 활용하는 ScaFE 프레임워크를 제안합니다. LLM이 의학 지식을 바탕으로 임상적 특징을 추출하는 Python 코드를 생성하여, 데이터 효율성, 개인정보 보호, 해석 가능성을 동시에 확보합니다.
EAGG: 기하학 인지 그래프 조건화를 통한 형태(Embodiment) 정렬형 파지 생성
EAGG는 다양한 형태의 말단 장치(end-effector)에 일반화될 수 있는 파지 생성 모델을 제안합니다. 기하학 인지 그래프 조건화를 통해 위상과 구동 방식이 다른 장치 간의 전이 성능을 극대화했습니다.
문맥 인식 및 관계 인식을 위한 통합된 그래프 검색 증강 생성 (Graph Retrieval-Augmented Generation) 프레임워크
기존 그래프 RAG의 한계를 극복하기 위해 문맥과 관계를 통합한 계층적 그래프 RAG 프레임워크인 HyGRAG를 제안합니다. 청크와 엔티티 노드를 결합한 하이브리드 구조를 통해 멀티홉 추론 성능을 크게 향상시켰습니다.
IsabeLLM: 합의 알고리즘의 형식 검증에 적용된 자동 정리 증명 (Automated Theorem Proving)
IsabeLLM은 Isabelle 내 자동 정리 증명을 위해 LLM을 활용하여 합의 알고리즘의 형식 검증을 자동화하는 연구입니다. RAG 프레임워크와 오류 추적 기술을 도입하여 Bitcoin의 작업 증명(PoW) 검증 성능을 개선했습니다.
대규모 언어 모델을 이용한 천문 데이터베이스 질의: ALeRCE text-to-SQL 시스템
LLM의 인컨텍스트 학습을 활용하여 천문 데이터베이스인 ALeRCE에 적용 가능한 text-to-SQL 시스템을 제안합니다. 스키마 연결, 프롬프트 분해, 자기 수정 모듈을 포함한 단계별 프레임워크를 통해 자연어를 SQL 쿼리로 변환하는 성능을 평가했습니다.
올바른 스승을 믿으세요: GUI Grounding을 위한 품질 인식 자기 증류 (Quality-Aware Self-Distillation)
GUI Grounding 성능 향상을 위해 품질 인식 자기 증류(Quality-Aware Self-Distillation) 기법을 제안합니다. 학생 모델의 잘못된 접두사로 인한 스승 신호의 품질 저하 문제를 소프트 정답 인식 게이팅과 스승-확률 스케일링을 통해 해결합니다.
첫 번째 증명 두 번째 배치
AI 시스템의 연구 수준 수학 문제 해결 능력을 평가하기 위해 10개의 수학 문제 세트를 활용한 테스트를 진행했습니다. 본 문서는 문제 구성, 방법론, 테스트 결과 및 인간과 AI의 풀이 비교 데이터를 포함합니다.
LLM 행동에서의 인지적 위축(COGNITIVE ATROPHY) 이해 및 측정에 관한 연구
LLM이 정신 건강 지원 시 사용자의 자립적 사고를 저해하는 '인지적 위축(Cognitive Atrophy)' 현상을 정의하고 이를 측정하기 위한 새로운 벤치마크를 제안합니다. 임상 전문가들이 참여하여 구축한 COGNITIVE ATROPHY BENCH를 통해 모델의 프로세스 수준 행동을 정밀하게 분석합니다.
메타 강화학습 (Meta-Reinforcement Learning)에서의 지식 재사용
메타 강화학습에서 태스크 지식을 이질적인 에이전트 간에 효율적으로 전이하는 새로운 프레임워크를 제안합니다. 베이지안 비매개변수적 사전 확률과 의미론적-크기 인터페이스를 통해 신체 구현(embodiment)의 차이를 극복하고 지식 재사용성을 높였습니다.
이 피드 구독하기
본 페이지의 콘텐츠는 AI가 공개된 소스를 기반으로 자동 수집·요약·번역한 것입니다. 원 저작권은 각 원저작자에게 있으며, 각 게시물의 “원문 바로가기” 링크를 통해 원문을 확인할 수 있습니다. 저작권자의 삭제 요청이 있을 경우 신속히 조치합니다.