본문으로 건너뛰기

© 2026 Molayo

Insights

AI가 자동으로 큐레이션·번역·정리하는 기술 동향 피드입니다.

arXiv cs.CL 294필터 해제

arXiv중요논문

Homology 기반 추측 검색(Speculative Retrieval)으로 RAG 속도 향상

본 논문은 대규모 지식 데이터베이스에서 발생하는 느린 검색 과정 문제를 해결하기 위해 'HaS'라는 새로운 프레임워크를 제안합니다. HaS는 쿼리 간의 유사성(homology) 관계를 활용하여, 들어오는 쿼리가 이전에 처리했던 쿼리와 유사한지 빠르게 추측하고 검증하는 방식을 사용합니다. 이를 통해 전체 데이터베이스 검색 과정을 건너뛰고 후보 문서를 신속하게 얻어낼 수 있습니다. 실험 결과에 따르면, HaS는 정확도 손실을 1~2% 미만으로 유지하면서 검색 지연 시간을 최대 36.99%까지 크게 단축시키는 것으로 나타났습니다.

ragllmretrieval
4월 23일1
arXiv중요논문

은유적 틀 분석: 출처 영역과 의미론적 프레임의 상호작용 연구

본 논문은 은유(Metaphor)가 단순히 하나의 '출처 영역(Source Domain)'만으로 설명되지 않으며, 출처 영역과 '의미론적 프레임(Semantic Frames)' 간의 복합적인 상호작용이 특정 이슈에 대한 이해를 어떻게 형성하는지 주장합니다. 연구진은 이를 포착할 수 있는 계산적 프레임워크를 제시했습니다. 이 프레임워크를 기후 변화 및 이민 담론 분석에 적용하여, 정치적 이념(보수/자유주의)에 따라 동일한 출처 영역 내에서도 사용되는 의미론적 프레임이 체계적으로 다름을 입증했습니다. 이는 개념 은유 이론과 NLP를 결

metaphorsemantic framesconceptual metaphor theory
4월 23일2
arXiv중요논문

BDD 스텝 중복 탐지기 'cukereuse': 정적이고 의미론적으로 강력한 도구

본 논문은 행동 주도 개발(BDD) 스위트에서 흔히 발생하는 스텝 텍스트 중복 문제를 해결하기 위해 'cukereuse'라는 새로운 도구를 소개합니다. 기존의 탐지기들은 테스트 실행이 필요하거나 특정 조직에 국한되는 한계가 있었습니다. cukereuse는 정확한 해싱, Levenshtein 비율, Sentence-Transformer 임베딩을 결합한 계층적 파이프라인을 사용하여 어떤 저장소에서도 사용할 수 있는 순수 정적(static)이며 구문 변형에 강한(paraphrase-robust) 스텝 중복 탐지기입니다. 347개 공개 깃

bddgherkinnlp
4월 23일1
arXiv논문

다국어 의료 질의응답 성능 향상을 위한 교차 언어 증거 활용 연구

본 논문은 영어, 스페인어 등 고자원 언어와 바스크어, 카자흐어 같은 저자원 언어를 아우르는 다국어 의료 질의응답 (Medical QA) 시스템을 연구합니다. 세 가지 외부 증거 소스(전문 지식 저장소, 웹 콘텐츠, LLM 내부 지식)를 활용하고, 단일/다중/교차 언어 검색 전략을 평가했습니다. 주요 결과는 모델 크기가 클수록 영어 성능이 우수하며, 고자원 언어에서는 웹 데이터를, 저자원 언어에서는 영어와 목표 언어를 결합한 교차 언어 검색이 가장 효과적임을 보여줍니다. 이는 외부 지식이 항상 성능 향상을 보장하지 않으며, 최적의전

multilingual qamedical aicross-lingual
4월 23일1
arXiv중요논문

말더듬(Stuttering) 음성 연구의 현황 분석 및 사용자 중심 가이드라인 제시

본 논문은 말더듬(stuttered speech) 관련 음성 기술 연구가 실제 사용자의 필요와 괴리되어 있음을 지적합니다. 이를 해결하기 위해 1) 기존 문헌에 대한 범위 검토(scoping review)와 2) 말더듬을 경험한 성인 및 언어 치료사 등 70명의 이해관계자 설문조사를 병행했습니다. 분석 결과, 현재 연구 방향이 실제 사용자의 요구를 충분히 반영하지 못하는 Gap을 발견하고, 이를 해소하기 위한 구체적인 연구 분류 체계(taxonomy)와 실질적인 가이드라인을 제시합니다.

stutteringspeech recognitionatypical speech
4월 23일1
arXiv중요논문

LLM StructCore: 스키마 기반 추론과 결정적 컴파일을 통한 의료 기록 자동화

의료 노트에서 복잡한 Case Report Form (CRF)을 채우는 작업은 노이즈가 많고 엄격한 출력 계약(strict output contracts) 때문에 어렵습니다. 본 논문은 이러한 문제를 해결하기 위해, 단일 단계 LLM 예측 방식 대신 2단계 구조를 제안합니다. 첫 번째 단계에서는 스키마 기반 추론 (Schema-Guided Reasoning, SGR)을 통해 핵심 도메인 키가 포함된 안정적인 JSON 요약을 생성하고, 두 번째 단계에서는 이 요약을 파싱하여 공식 통제 어휘(controlled vocabulary)에

llmclinical_nlpinformation_extraction
4월 23일1
arXiv논문

LLM 추론 사슬의 논리적 연결자 제어를 통한 성능 개선 방안

대규모 언어 모델(LLM)은 다단계 논리 추론에서 구조적 취약성을 보이며, 단일 오류가 전체 사슬에 영향을 미칩니다. 본 연구는 이러한 취약성의 핵심 지점을 '논리 연결자(logical connectives)'로 식별하고, 이 지점들을 제어하는 새로운 프레임워크를 제안합니다. 저희의 다층적 접근 방식은 (1) 기울기 기반 논리 스티어링, (2) 국소화된 분기 탐색, 그리고 (3) 표적 전환 선호도 최적화를 포함하여, 추론 과정 중 논리가 중요한 교차점(logic-critical junctions)에만 개입합니다. 이 방법은 전역적인

llmreasoninglogical_connectives
4월 23일1
arXiv중요논문

LLM 에이전트의 반복 게임에서 나타나는 사회적 평판 및 기만 역학 분석

본 연구는 대규모 언어 모델(LLM) 에이전트가 반복적인 숨겨진 역할 기반의 심리 게임인 '아발론 (Avalon)'을 플레이할 때 나타나는 사회적 역학 관계를 분석합니다. 기존 단일 게임 성능 평가와 달리, 에이전트들이 이전 상호작용의 기억(long memory)을 유지하는 것이 핵심입니다. 연구 결과, 장기 기억은 에이전트 간에 '평판 (reputation)' 시스템을 자연스럽게 형성하며, 이 평판은 역할 수행 방식과 연관되어 팀 참여도에 직접적인 영향을 미칩니다. 또한, 높은 추론 노력(reasoning effort)을 기울이는

llmagentgame theory
4월 23일1
arXiv중요논문

시간, 신뢰도 기반의 지식 검색 강화: SmartVector 프레임워크

기존 RAG 시스템은 벡터 임베딩을 시간적/맥락적 정보가 결여된 정적인 아티팩트로 취급하여 지식 검색의 정확도가 떨어지는 문제가 있습니다. 본 논문은 이러한 한계를 극복하기 위해, 기억 공고화(memory consolidation) 과정을 모방한 SmartVector 프레임워크를 제안합니다. 이 프레임워크는 임베딩에 시간적 인식(temporal awareness), 신뢰도 감쇠(confidence decay), 관계성 인식(relational awareness) 세 가지 속성을 추가하여 검색 파이프라인을 개선합니다. 결과적으로, 순

ragvector embeddingsknowledge graph
4월 23일1
arXiv논문

목표 조건 강화학습 기반의 지침 추종 계획 추출 프레임워크 (SuperIgor)

본 글은 SuperIgor라는 새로운 프레임워크를 소개합니다. 이 방법론은 기존 방식처럼 미리 정의된 하위 작업에 의존하지 않고, 언어 모델(LLM)이 자체 학습 메커니즘을 통해 고수준 계획(high-level plans)을 생성하고 개선할 수 있게 합니다. 핵심은 강화학습 (RL) 에이전트가 생성된 계획을 따르면서 발생하는 피드백을 활용하여 LLM과 플래너가 상호 작용하며 함께 발전하는 코-트레이닝(co-training) 루프를 구축한다는 점입니다. 이를 통해 수동 데이터셋 주석 작업의 부담을 줄이고, 복잡한 환경에서도 높은 지침

reinforcement learningllmplanning
4월 23일1
arXiv논문

LLM 에이전트 팀의 협업 능력이 과학적 성과를 예측하는 방법

다중 에이전트 시스템을 활용한 과학 연구 워크플로우에서, LLM 에이전트 팀의 협업 능력이 최종 성과를 예측하는 것이 확인되었습니다. 본 연구는 35개의 오픈 가중치(open-weight) LLM 모델들을 대상으로 6가지 행동 경제학 게임을 수행하게 하고, 여기서 도출된 '협력 프로파일'을 측정했습니다. 그 결과, 단순히 지능이 높은 모델보다도 자원 제약 하에서 효과적으로 협력하고 팀 생산성을 극대화하는(multiplicative team production) 모델들이 데이터 분석, 모델 구축, 과학 보고서 작성 등 실제 AI-과학

llmmulti-agentcooperation
4월 23일1
arXiv중요논문

LLM의 교차적 공정성 평가: 스테레오타입 편향 분석

본 연구는 대규모 언어 모델(LLMs)이 사회적으로 민감한 영역에서 사용됨에 따라 발생하는 '교차적 공정성(intersectional fairness)' 문제를 체계적으로 평가했습니다. 두 가지 벤치마크 데이터셋을 활용하여 6개의 LLM을 대상으로 모호하고 해소된(disambiguated) 문맥에서의 편향성을 분석했습니다. 주요 결과는 다음과 같습니다: 현대 LLMs가 모호한 문맥에서는 전반적으로 우수한 성능을 보이지만, 이는 공정성 지표의 정보성을 제한합니다. 특히 '해소된 문맥'에서 모델의 정확도는 정답이 스테레오타입과 일치할지

llmfairnessbias detection
4월 23일1
arXiv중요논문

라틴어-영어 이중 언어 QA 벤치마크 'RespondeoQA' 공개

본 논문은 라틴어와 영어라는 두 가지 언어를 결합한 독특하고 전문적인 질문 답변(Question Answering, QA) 벤치마크인 'RespondeoQA'를 소개합니다. 약 7,800개의 Q&A 쌍으로 구성된 이 데이터셋은 1800년대부터 현재까지의 라틴어 교육 자료(시험, 퀴즈 등)에서 추출되었습니다. 이는 라틴어 중심의 QA 벤치마크로는 최초이며, 지식 기반 질문부터 다단계 추론(multihop reasoning), 제약 번역(constrained translation)에 이르는 다양한 유형을 포괄합니다. LLaMa 3, Q

latinenglishqa benchmark
4월 23일1
arXiv논문

코드 RL의 언어 간 전이 성능 향상: Parallel-SFT 제안

본 논문은 대규모 언어 모델(LLM)이 특정 프로그래밍 언어(PL)에 편중된 학습 데이터로 인해 다른 저자원 PL에서 성능 저하를 겪는 문제를 해결하고자 합니다. 연구진은 효과적인 코드 강화학습 (RL) 전이를 위해서는 일반화 가능한 지도 미세 조정 (SFT) 초기화가 필수적이라고 가정하고, '병렬 프로그램(parallel programs)'을 활용하는 **Parallel-SFT** 전략을 제안합니다. 이 방법은 기능적으로 동등한 코드를 여러 PL로 묶어 데이터에 주입하며, 이를 통해 모델의 잠재 공간(latent space)이 언

llmreinforcement learningcode generation
4월 23일1

이 피드 구독하기

본 페이지의 콘텐츠는 AI가 공개된 소스를 기반으로 자동 수집·요약·번역한 것입니다. 원 저작권은 각 원저작자에게 있으며, 각 게시물의 “원문 바로가기” 링크를 통해 원문을 확인할 수 있습니다. 저작권자의 삭제 요청이 있을 경우 신속히 조치합니다.