본문으로 건너뛰기

© 2026 Molayo

Insights

AI가 자동으로 큐레이션·번역·정리하는 기술 동향 피드입니다.

arXiv cs.AI 2012필터 해제

arXiv논문

SPEA2$^+$: 증명 가능한 실행 시간 보장을 갖춘 SPEA2의 개선된 밀도 추정

본 논문은 다목적 최적화 알고리즘인 SPEA2의 실행 시간 분석을 수행하고, 기존 방식의 한계를 지적했습니다. 그 결과, SPEA2가 OneTrapZeroTrap 벤치마크에서 파레토 전선을 효율적으로 커버하지 못함을 증명했습니다. 이를 개선하기 위해 모든 쌍별 거리를 고려하는 새로운 변형인 SPEA2$^+$를 제안했으며, 이 알고리즘은 다른 대표적인 알고리즘과 동등한 성능을 보장합니다.

6일 전0
arXiv논문

TAHOE: 경험 기반 자동 힌트 최적화를 통한 Text-to-SQL

TAHOE는 경험 기반의 자동 힌트 최적화를 통해 Text-to-SQL 성능을 향상시키는 시스템입니다. 오류 기반의 힌트 뱅크를 구축하여 구문 및 의미론적 힌트를 추출하고, 이를 통해 모델 파라미터 업데이트 없이도 SQL 생성 정확도를 크게 높입니다.

6일 전0
arXiv논문

DIRECT: Embodied Planners에서 테스트 시간 연산(Test-Time Compute)을 언제, 어디에 할당해야 하는가?

체화된 에이전트를 위한 VLM 플래너의 테스트 시간 연산(test-time compute) 효율성을 최적화하는 DIRECT 프레임워크를 제안합니다. 무분별한 연산 확장 대신 멀티모달 문맥을 활용해 연산을 전략적으로 할당함으로써, 지연 시간을 대폭 줄이면서도 높은 성공률을 유지합니다.

6일 전0
arXiv논문

제거하지 말고 재라우팅하라: 시각-언어 모델(VLM)을 위한 복구 가능한 시각적 토큰 라우팅

기존 VLM의 시각적 토큰 제거 방식은 비가역적이라 정보 손실이 발생합니다. 이를 해결하기 위해 선택되지 않은 토큰을 폐기하지 않고 다음 단계에서 재사용하는 'Reroute' 기술을 제안합니다.

6일 전0
arXiv논문

멀티모달 LLM을 활용한 모바일 사용자 경험(UX) 추론: 태스크, 벤치마크 및 접근 방식

멀티모달 LLM을 활용해 모바일 UX를 평가하는 새로운 벤치마크인 UXBench와 강화학습 기반의 UI-UX 모델을 제안합니다. UI-UX는 보상 라우팅과 비대칭 전이 보상 메커니즘을 통해 기존 모델보다 뛰어난 UI 추론 성능을 보여줍니다.

6일 전0
arXiv논문

어떤 조건에서 기계는 진정으로 창의적이 될 수 있는가?

기계의 진정한 창의성을 정의하기 위한 새로운 프레임워크를 제안하는 논문입니다. 단순한 출력물의 참신함을 넘어, 디자인익스(Designics) 이론을 바탕으로 환경과의 상호작용 및 재귀적 개입을 통한 구조적 변형을 창의성의 핵심으로 정의합니다.

6일 전0
arXiv논문

의료 영상 AI의 환각(Hallucination): 규제 제약 하에서의 분류, 탐지 및 완화를 위한 교차 모달리티 분석 프레임워크

의료 영상 AI의 환각 현상을 분류, 탐지 및 완화하기 위한 교차 모달리티 분석 프레임워크를 제안합니다. 의료 특화 모델과 범용 모델의 환각 특성을 비교하고, FDA 규제 지침에 부합하는 효과적인 완화 전략을 연구합니다.

6일 전0
arXiv논문

LLM-as-an-Investigator: 견고한 대화형 문제 진단을 위한 증거 우선 추론

사용자의 잘못된 가설에 동조하는 LLM의 '사용자 주도적 아첨' 문제를 해결하기 위한 새로운 에이전트 방법론을 제안합니다. 증거를 우선적으로 수집하여 가설을 검증하는 'LLM-as-an-Investigator' 방식을 통해 기술적 문제 진단의 정확도를 높입니다.

6일 전0
arXiv논문

ReSET: 단계 인지 온도 스케일링(Step-Aware Temperature Scaling)을 통한 정확한 지연 시간 민감형 NVFP4 추론

NVFP4 저정밀도 양자화 사용 시 발생하는 추론 정확도 저하와 지연 시간 문제를 해결하기 위한 ReSET 기술을 제안합니다. 단계별 불확실성을 기반으로 디코딩 온도를 조절하고 최적화된 CUDA 커널을 설계하여 정확도와 속도를 동시에 개선했습니다.

6일 전0
arXiv논문

ComAct: COM-as-Action 패러다임을 통한 전문 소프트웨어 조작의 재정의

기존 GUI 및 API 기반 에이전트의 한계를 극복하기 위해 COM(Component Object Model)을 활용한 새로운 패러다임인 COM-as-Action을 제안합니다. CAD 소프트웨어 조작을 위한 벤치마크 ComCADBench와 자기 수정 에이전트 ComActor를 통해 전문 소프트웨어 제어의 새로운 가능성을 제시합니다.

6일 전0
arXiv논문

Brick: Mixture-of-Models (MoM) 패러다임을 위한 공간 능력 라우팅

Brick은 기존 LLM 라우터의 한계를 극복하기 위해 제안된 멀티모달 라우터입니다. 이 시스템은 쿼리별 난이도 추정치와 모델의 여섯 가지 능력 차원 점수를 결합하여 비용 페널티가 적용된 기하학적 규칙으로 요청을 디스패치합니다. 테스트 결과, Brick은 최대 품질 설정에서 최고 성능을 달성했으며, 중립적인 프로파일에서도 높은 정확도를 유지하며 비용 효율성을 크게 개선했습니다.

6일 전0
arXiv논문

EPIG: 개인화된 이미지 생성을 위한 감정 기반 프롬프팅 (Emotion-Based Prompting for Personalised

EPIG는 심리학적 감정 모델을 활용하여 텍스트-투-이미지 확산 모델의 감정 표현력을 높이는 새로운 프롬프팅 방법론을 제안합니다. 별도의 모델 재학습 없이도 프롬프트를 풍부하게 만들어, 생성된 이미지의 감정적 일관성과 각성(arousal) 제어 능력을 크게 향상시킵니다.

6일 전0
arXiv논문

해양 사고 근본 원인 분석을 위한 다중 필드 하이브리드 검색 증강 생성 (Multi-Field Hybrid Retrieval-Augmented

해양 사고 근본 원인 분석(RCA)을 자동화하기 위해 다중 필드 하이브리드 RAG 프레임워크를 제안합니다. KMST 보고서 데이터를 구조화된 지식 베이스로 변환하고 RRF를 통해 검색 성능을 극대화하여 일관된 보고서 작성을 지원합니다.

6일 전0
arXiv논문

조음 장애 음성 인식을 위한 개인화된 연합 학습 방안 연구

본 논문은 조음 장애 화자의 음성 인식을 위한 개인화된 연합 학습(FL) 방안을 연구합니다. 기존 FL의 이질성 문제를 해결하기 위해 파라미터 및 임베딩 기반 두 가지 집계 전략을 제안했습니다. 실험 결과, 제안 방법들은 정규화 FedAvg 대비 WER 감소를 보이며 우수한 성능을 입증했습니다.

6일 전0
arXiv논문

판결에서 과정으로: 다단계 사실 검증을 위한 에이전트 기반 강화학습

본 연구는 복잡한 주장의 자동 사실 검증을 위해 에이전트 기반 강화학습 프레임워크인 ProFact를 제안합니다. ProFact는 주장 분해, 증거 탐색, 답변 생성 등 다단계 워크플로우 전체를 통합적으로 최적화하는 정책을 학습합니다. 특히 과정 전반에 걸쳐 단계 수준의 보상을 제공하여 검증 성능과 효율성을 모두 향상시킵니다.

6일 전0
arXiv논문

ERTS: 유한한 결과 공간에서의 의미론적 교란을 통한 윤리 AI의 적대적 강건성 테스트

AI 시스템의 윤리적 추론에 대한 적대적 조작 강건성을 평가하기 위한 새로운 프레임워크인 ERTS를 제안합니다. 22차원 윤리적 결과 공간과 의미론적 교란 함수를 활용하여 Gemini 2.0 Flash 및 Llama 3.2 등 주요 모델의 윤리적 취약성을 정밀하게 측정합니다.

6일 전0
arXiv논문

시각-언어 구성성(Visio-Linguistic Compositionality) 향상을 위한 교차 모달 마스크 구성 개념 모델링

시각-언어 모델(VLM)의 구성적 이해 능력을 향상시키기 위한 새로운 프레임워크 MACCO를 제안합니다. 한 모달리티의 구성 개념을 마스킹하고 다른 모달리티의 문맥으로 재구성하는 방식을 통해 객체 관계 및 속성 결합 능력을 개선합니다.

6일 전0
arXiv논문

HYDRA-X: 총체적 시각적 토크나이저를 갖춘 네이티브 통합 멀티모달 모델

HYDRA-X는 단일 Vision Transformer 내에서 이미지와 비디오 토큰화를 통합하는 최초의 네이티브 통합 멀티모달 모델(UMM)입니다. 시공간 재구성 능력과 의미론적 인식을 잠재 공간에 임베딩하여 이미지 및 비디오 이해와 생성 성능을 극대화했습니다.

6일 전0
arXiv논문

에이전트형 AI 도입에 따른 아키텍처 품질 마이닝: Java 저장소에 대한 인과 연구

에이전트형 AI 도입이 Java 오픈 소스 저장소의 소프트웨어 아키텍처 품질에 미치는 인과적 영향을 분석한 연구입니다. 분석 결과, AI 사용으로 코드 라인 수는 증가했으나 아키텍처 스멜 밀도 감소는 실제 개선이 아닌 분모 효과에 의한 착시임이 밝혀졌습니다.

6일 전0
arXiv논문

비디오를 이용한 연안 파랑 주기 추정을 위한 물리 가이드 기반 시공간 학습

비디오 스트림을 활용해 연안 파랑 주기를 추정하는 물리 가이드 기반의 딥 시공간 학습 프레임워크를 제안합니다. 물리 정보 기반 정규화와 Sim-to-Real 전이 학습을 통해 예측 정확도와 물리적 일관성을 동시에 확보했습니다.

6일 전0

이 피드 구독하기

본 페이지의 콘텐츠는 AI가 공개된 소스를 기반으로 자동 수집·요약·번역한 것입니다. 원 저작권은 각 원저작자에게 있으며, 각 게시물의 “원문 바로가기” 링크를 통해 원문을 확인할 수 있습니다. 저작권자의 삭제 요청이 있을 경우 신속히 조치합니다.