Insights
AI가 자동으로 큐레이션·번역·정리하는 기술 동향 피드입니다.
arXiv cs.AI 371건필터 해제
음성 특징 기반 평가: SpeechParaling-Bench 소개
본 논문은 자연스러운 인간-컴퓨터 상호작용에 필수적이지만, 현재 대규모 오디오-언어 모델(LALMs)에서 평가가 미흡했던 음성 비언어적 단서(paralinguistic cues)를 체계적으로 평가하기 위한 벤치마크인 SpeechParaling-Bench를 제안합니다. 이 벤치마크는 기존보다 훨씬 방대한 100개 이상의 세밀한 특징을 지원하며, 영어-중국 병렬 음성 데이터 1,000개 이상으로 구성되어 있습니다. 평가 방식으로는 절대 점수 부여 대신 LALM 기반의 쌍별 비교(pairwise comparison) 파이프라인을 도입하여
멀티모달 추론 신뢰성 확보를 위한 새로운 패러다임 제안
최근 급증하는 Vision-Language Models (VLMs)는 통합적 지식 발견의 시대를 열었다고 평가받지만, 현재 모델들이 멀티모달 데이터를 신뢰성 있게 합성한다는 전제 자체가 위험하다. 본 논문은 기존의 'Vision Encoder-Projector-LLM' 패러다임이 시각 입력에서 제대로 된 지식을 추출하지 못하고, 오히려 강력한 언어 사전 지식(language priors)에 의존해 시각적 표현 병목 현상을 우회하는 기능적 맹점(functional blindness)을 보인다고 주장한다. 이를 해결하기 위해 데이터셋의
ORPHEAS: 그리스어-영어 검색 증강 생성 모델 소개
본 논문은 이중 언어(그리스어-영어) 환경에서 효과적인 검색 증강 생성 (RAG)을 위해 특화된 임베딩 모델 ORPHEAS를 제안합니다. 기존의 범용 다국어 임베딩 모델들은 너무 많은 언어에 자원을 분산시켜 그리스어 같은 형태론적으로 복잡한 언어의 특징이나 도메인별 용어를 충분히 포착하지 못하는 한계가 있습니다. ORPHEAS는 지식 그래프 기반 미세 조정 방법론을 사용하여 다양한 다중 도메인 코퍼스에서 학습되었습니다. 실험 결과, ORPHEAS는 기존 최신 범용 모델들보다 우수한 성능을 보였으며, 이는 형태론적으로 복잡한 언어에만
의사결정 과정 가이드: 불확실성 속 최적의 선택 전략
본 글은 높은 책임이 따르는 상황에서의 의사결정 능력 향상에 초점을 맞춥니다. 개인이 불확실성, 자원 부족, 시간 제약 등 복합적인 환경 속에서도 최상의 성과를 내도록 돕는 방법론을 제시합니다. 특히 인공지능(AI)의 역할을 강조하며, AI가 상황 인식, 의사결정 구조화, 유연성을 높여 인간의 인지 능력을 보강하는 방안을 탐구합니다. 복잡성, 불확실성, 긴급성이 결합된 시나리오에서 필요한 시스템적 및 행동적 접근법을 종합적으로 다룹니다.
폭풍 해일 예측 정확도 향상: StormNet 소개
본 연구는 열대성 사이클론으로 인한 연안 지역의 폭풍 해일(storm surge) 예측의 어려움을 해결하기 위해 Spatio-temporal Graph Neural Network (GNN) 기반 모델인 StormNet을 제안합니다. StormNet은 기존 수치 모델의 한계를 극복하고, 그래프 컨볼루션(Graph Convolution, GCN)과 그래프 어텐션(Graph Attention, GAT), 그리고 LSTM 구성 요소를 결합하여 복잡한 공간적 및 시간적 의존성을 포착합니다. 미국 걸프 코스트의 역사적 허리케인 데이터를 학습한
양자 신경망 (QNN) 테스트를 위한 돌연변이 검증 프레임워크, QuanForge
본 논문은 양자 컴퓨팅과 딥러닝의 결합으로 주목받는 QNN의 테스트 어려움을 해결하기 위해 'QuanForge'라는 돌연변이 검증 프레임워크를 제안합니다. QNN은 복잡한 양자 역학 및 해석 가능성 문제로 인해 기존 테스트 방식으로는 검증이 어렵습니다. QuanForge는 통계적 돌연변이 살상(statistical mutation killing) 기준을 도입하여 신뢰성을 높였으며, 게이트와 파라미터 레벨에서 9가지의 사후 학습 돌연변이 연산자(post-training mutation operators)를 포함합니다. 이를 통해 양자
AI 공청회 데이터의 대표성 검증: 참여형 출처 추적 방법론
인공지능(AI)이 정책 자문 과정에서 대규모 공공 의견을 요약하는 것이 일반화되고 있지만, 이 요약본이 원본 참여자 집단을 얼마나 충실하게 대표하는지에 대한 공식적인 감사 체계가 부족합니다. 기존의 AI 설명 가능성(explainability)이나 환각 탐지 기법들은 출력물의 품질에 초점을 맞추어 입력 데이터의 충실도 문제를 다루지 못했습니다. 본 논문은 '참여형 출처 추적 (participatory provenance)'이라는 새로운 측정 프레임워크를 제안합니다. 이 방법론은 최적 수송 이론(optimal transport), 인
자체 개선형 다중 에이전트 시스템 최적화 프레임워크 (TPGO)
본 논문은 복잡한 다중 에이전트 시스템(MAS) 설계를 자동화하고 최적화하는 새로운 프레임워크인 '텍스트 기반 파라미터 그래프 최적화 (Textual Parameter Graph Optimization, TPGO)'를 제안합니다. 기존의 방법들이 단순한 평면적인 프롬프트 튜닝에 머물러 MAS의 복잡한 상호작용 구조를 다루지 못하고 정적이라는 한계를 가졌습니다. TPGO는 MAS를 에이전트, 도구, 워크플로우가 모듈화된 노드로 구성된 '텍스트 기반 파라미터 그래프 (TPG)'로 모델링합니다. 특히, 실행 과정에서 얻은 자연어 피드백을
ONOTE: 음악 지능을 위한 다중 모드 표기법 평가 벤치마크
음악 지능 분야에서 청각, 시각, 기호적 영역 간의 정밀한 연계가 필요한 '다중 모드 표기법 처리(Omnimodal Notation Processing, ONP)'는 현재 연구가 파편화되어 있습니다. 기존 모델들은 단순 패턴 인식에 머물러 음악적 논리 구조를 이해하는 데 한계를 보입니다. 본 논문은 이러한 문제를 해결하기 위해, 주관적인 평가 편향을 제거하고 다양한 표기 시스템에서 엄격한 기준을 제시하는 다중 포맷 벤치마크인 ONOTE를 제안합니다. ONOTE 평가는 최신 모델들이 지각적 정확도와 음악 이론적 이해 사이에 근본적인
COMPASS: 언어 간섭을 최소화하는 다국어 PEFT 프레임워크
LLM은 언어별 성능 편차가 크고, 단순한 다국어 파인튜닝(fine-tuning)은 종종 부정적인 교차 언어 간섭을 일으킵니다. 저희는 이러한 문제를 해결하기 위해 COMPASS (COntinual Multilingual PEFT with Adaptive Semantic Sampling)라는 새로운 데이터 중심 프레임워크를 제안합니다. COMPASS는 적절하게 선별된 보조 다국어 데이터를 사용하여 경량의 언어별 어댑터(adapter)를 학습하는 Parameter-Efficient Fine-Tuning (PEFT) 방식을 활용합니다.
에이전트 성능 향상을 위한 보충 자료 생성 훈련 (SGT)
거대 언어 모델(LLM)을 에이전트 작업에 맞게 미세 조정하는 것은 높은 컴퓨팅 비용과 긴 반복 주기 때문에 비효율적입니다. 본 논문은 이러한 문제를 해결하기 위해 '보충 자료 생성 훈련 (Supplement Generation Training, SGT)'이라는 효율적인 방법을 제안합니다. SGT는 작은 LLM을 사용하여 원래 입력에 추가할 유용한 보충 텍스트를 생성하도록 훈련합니다. 이 보충 자료가 큰 모델의 성능을 향상시키며, 근본적인 대형 모델 자체를 수정하지 않고도 작업 요구사항에 맞춰 동적으로 적응할 수 있습니다. 이 접근
이 피드 구독하기
본 페이지의 콘텐츠는 AI가 공개된 소스를 기반으로 자동 수집·요약·번역한 것입니다. 원 저작권은 각 원저작자에게 있으며, 각 게시물의 “원문 바로가기” 링크를 통해 원문을 확인할 수 있습니다. 저작권자의 삭제 요청이 있을 경우 신속히 조치합니다.