Insights
AI가 자동으로 큐레이션·번역·정리하는 기술 동향 피드입니다.
© 2026 Molayo
AI가 자동으로 큐레이션·번역·정리하는 기술 동향 피드입니다.
본 페이지의 콘텐츠는 AI가 공개된 소스를 기반으로 자동 수집·요약·번역한 것입니다. 원 저작권은 각 원저작자에게 있으며, 각 게시물의 “원문 바로가기” 링크를 통해 원문을 확인할 수 있습니다. 저작권자의 삭제 요청이 있을 경우 신속히 조치합니다.
arXiv cs.CL (NLP) 1795건필터 해제
RAG 시스템에서 발생하는 국소적 환각을 토큰 수준에서 탐지하는 CORTEX 방법론을 제안합니다. LLM의 내부 표현을 비교하여 문서 유도 효과를 포착함으로써 환각의 위치를 정밀하게 식별합니다.
기업용 복잡한 데이터베이스 환경에서 NL2SQL 성능을 높이기 위해 시맨틱 레이어를 활용하는 새로운 에이전트 구조를 제안합니다. 중간 표현인 SMQ를 통해 SQL 방언 문제를 해결하고, Gemini 1.5 Pro를 활용해 Spider2-snow 벤치마크에서 높은 정확도를 기록했습니다.
LLM이 논리적 오류가 포함된 설득에 얼마나 강건한지 평가하기 위한 새로운 벤치마크 LoFa를 제안합니다. 멀티 에이전트 파이프라인과 다회차 토론 프레임워크를 통해 모델의 회복력을 측정하며, 새로운 지표인 LFR@k를 통해 취약성을 정량화합니다.
MLLM의 환각 문제를 해결하기 위해 텍1-이미지 교차 어텐션 역학을 정렬하는 ADAPT 프레임워크를 제안합니다. 어텐션 드리프트를 탐지하고 시각적 앵커를 통해 정렬함으로써 환각률을 40%-60% 감소시켰습니다.
S2S AI 에이전트의 운율 및 리듬을 평가하기 위한 새로운 참조 기반 평가 체계를 제안합니다. 기존의 통합 통계 방식 대신, 인간의 대화 특성을 반영한 매칭된 참조 체계를 통해 모델의 출력물을 더 정확하고 해석 가능하게 검증합니다.
본 연구는 NLP 분야에서 저자 팀의 기관 구성이 논문의 참신성에 미치는 영향을 분석합니다. 세밀한 지식 엔티티를 추출하여 팀 유형별로 방법론, 데이터셋, 도구, 지표의 조합이 참신성에 기여하는 방식을 규명합니다.
1991년부터 2021년까지 26,000개 이상의 문헌정보학 논문을 머신러닝으로 분석하여 연구 방법론의 변화를 조사했습니다. 연구 전략이 개념적 접근에서 실증적 연구로, 주제가 시스템 중심에서 사용자 중심으로 변화했음을 밝혀냈습니다.
기존 AI 생성 텍스트 탐지기의 취약점을 보완하기 위해 내용과 표현의 관점을 결합한 Triospect 프레임워크를 제안합니다. 다양한 공격 시나리오와 벤치마크 실험을 통해 기존 모델 대비 높은 강건성과 탐지 성능 개선을 입증했습니다.
리랭킹이 항상 성능을 향상시키지 않는다는 점에 주목하여, 모델의 불확실성을 기반으로 리랭킹 여부를 결정하는 'Training-Free Gated Reranking' 기법을 제안합니다. 실험 결과, 성능 향상과 동시에 계산 비용을 대폭 절감할 수 있음을 입증했습니다.
비전형적 음성 인식(ASR) 평가 시 발생하는 '있는 그대로의 전사(verbatim)'와 '의도된 전사(intended)' 간의 혼동 문제를 다룹니다. 말더듬 발화 사례를 통해 11개 모델을 벤치마킹하며, 사용 사례에 맞는 적절한 참조 기준 선택의 중요성을 강조합니다.
SeKV는 긴 컨텍스트 LLM의 메모리 병목을 해결하기 위해 계층적 시맨틱 메모리를 활용하는 해상도 적응형 KV 캐시 기술입니다. GPU에는 요약 벡터를, CPU에는 SVD 기저를 저장하여 필요할 때만 토큰 수준으로 정밀하게 재구성합니다. 이를 통해 성능 저하를 최소화하면서 GPU 메모리 사용량을 53.3% 절감했습니다.
UniSAE는 화자, 감정, 콘텐츠를 통합적으로 편집할 수 있는 새로운 음성 속성 편집 프레임워크입니다. DPPG 표현을 도입하여 서브-음소부터 단어 수준까지 정밀한 편집을 지원하며, 확산 기반 디코더를 통해 자연스러운 음성을 생성합니다.
규제 산업 내 LLM 배포를 위해 데이터 민감도와 질의 복잡도를 사전에 평가하는 '분류기 게이트 라우팅' 아키텍처를 제안합니다. 이 방식은 PII 포함 여부에 따라 적절한 모델로 라우팅하여 데이터 거주성을 보장하고 비용과 지연 시간을 획기적으로 줄입니다.
3D Visual Grounding의 계산 효율성과 정확도를 높이기 위해 공간적 프루닝을 도입한 PruneGround 프레임워크를 제안합니다. VLM을 활용한 공간 탐색 범위 축소와 다중 뷰 추론을 통해 복잡한 3D 장면에서도 최첨단 성능을 달성했습니다.
텍스트 속성 그래프(TAG) 학습을 위해 텍스트 추론과 그래프 메시지 패싱을 통합한 마스크 확산 언어 모델(TAG-DLM)을 제안합니다. 이 모델은 토폴로지 어텐션 마스크를 통해 그래프 구조를 주입하며, 별도의 미세 조정 없이도 다양한 그래프 태스크를 수행할 수 있습니다.
의료 분야의 복잡한 워크플로우를 평가하기 위한 새로운 벤치마크 스위트인 HealthAgentBench를 소개합니다. 7개 카테고리, 54개의 작업을 통해 AI 에이전트의 장기 추론 및 다단계 솔루션 실행 능력을 엄격하게 측정합니다.
알츠하이머병 탐지를 위해 음성 데이터의 의미, 의존, 공기 그래프를 결합한 멀티 뷰 게이트형 그래프 어텐션 네트워크를 제안합니다. ADReSSo 데이터셋 실험 결과 90%의 높은 정확도를 기록하며 임상적 이질성에 대한 대응력을 입증했습니다.
LLM의 문체적 도용을 EU 저작권법의 '실질적 유사성' 기준으로 평가하는 PSALM 프레임워크를 제안합니다. 연구 결과, 미세 조정된 모델은 단순 암기를 넘어 서사 패턴까지 체계적으로 도용하며, 기존의 보호 조치로는 이를 완벽히 방지하기 어렵다는 것을 보여줍니다.
데이터베이스 호출 실패 시 LLM 에이전트가 발생하는 환각 현상을 줄이기 위한 경량 프롬프팅 기반의 복구 전략을 연구합니다. 가이드형 재시도(Guided-Retry) 전략을 통해 재학습 없이도 다양한 오픈 웨이트 모델에서 환각 발생률을 유의미하게 감소시켰습니다.
LOPA는 멀티모달 거대 언어 모델(MLLM)의 구어 평가(SLA) 시 언어 습득의 순서 구조를 반영하기 위해 제안된 새로운 프레임워크입니다. 잠재 공간에 순서 기하학적 사전 정보를 강제하는 정규화 도구를 통해 효율적인 모델링을 지원합니다.