본문으로 건너뛰기

Home About Portfolio Blog Insights Resume Contact

Home About Portfolio Blog Insights Resume Contact

© 2026 Molayo

Insights

AI가 자동으로 큐레이션·번역·정리하는 기술 동향 피드입니다.

© 2026. Molayo. All rights reserved.

개인정보 처리방침|이용약관

Home About Portfolio Blog Insights Resume Contact

Home About Portfolio Blog Insights Resume Contact

© 2026 Molayo

Insights

AI가 자동으로 큐레이션·번역·정리하는 기술 동향 피드입니다.

전체 AI Research AI Engineering Claude Code Codex Game Dev Hardware & Silicon Finance & Markets AI Design

이 피드의 글은 AI가 공개된 소스를 자동으로 수집·요약·번역한 것이에요. 저작권 안내를 확인해주세요.

본 페이지의 콘텐츠는 AI가 공개된 소스를 기반으로 자동 수집·요약·번역한 것입니다. 원 저작권은 각 원저작자에게 있으며, 각 게시물의 “원문 바로가기” 링크를 통해 원문을 확인할 수 있습니다. 저작권자의 삭제 요청이 있을 경우 신속히 조치합니다.

이 피드 구독하기

RSSFeedly, Inoreader 등으로 구독

API/api/search?q=검색어

AIllms.txt로 AI 크롤링 가이드

© 2026. Molayo. All rights reserved.

개인정보 처리방침|이용약관

필터arXiv cs.CL836건

arXivAI 번역논문

SemEval-2026 Task 8에서의 Caraman: 쿼리 재작성(Query Rewriting), 하이브리드 검색(Hybrid

SemEval-2026 Task 8(MTRAGEval)의 Retrieval 태스크에 참여한 Caraman 시스템의 방법론과 성과를 설명합니다. LoRA로 미세 조정된 Qwen 2.5 7B를 활용한 쿼리 재작성, BM25와 밀집 검색을 결합한 하이브리드 검색, 그리고 BGE-reranker-v2-m3를 이용한 재순위화의 3단계 파이프라인을 통해 상위 8위를 기록했습니다.

arXivAI 번역논문

은유가 Attention의 전부가 아니다

본 연구는 대규모 언어 모델(LLM)의 안전성 우회 기법인 '문학적 탈옥(literary jailbreaks)'이 성공하는 원인을 분석했습니다. 기존의 사후 학습(post-training)된 안전 메커니즘은 시적인 변환이나 문체적 재구성을 통해 쉽게 우회될 수 있습니다. 연구진은 어텐션 패턴 해석 가능성 분석과 입력 수준 절제 연구를 수행하여, 탈옥 성공이 모델이 시적 형식을 인식하지 못해서가 아니라, 유해 콘텐츠 탐지 메커니즘과 독립적인 별개의 처리 패턴을 유도하기 때문임을 밝혀냈습니다. 따라서 LLM의 견고성을 확보하려면 스타일 변화에 따른 행동 변화까지 고려하는 안전 메커니즘 설계가 필요합니다.

arXivAI 번역논문

당신의 광고를 디자인하세요: 통합 자기회귀 모델 (Unified Autoregressive Models)을 이용한 개인화된 광고 이미지 및

본 논문은 개인화된 광고 이미지와 텍스트 생성을 위해 통합 자기회귀 모델(Unified Autoregressive Models)을 제안합니다. 기존 방식들이 이미지와 텍스트를 분리하여 처리해 정렬에 어려움이 있었던 문제를 해결하고자, 본 연구는 두 요소를 단일 토큰 시퀀스로 처리하는 통합 프레임워크를 도입했습니다. 이를 통해 광고의 일관성과 품질을 높여 사용자 요구사항에 맞는 고도로 개인화된 콘텐츠 생성이 가능함을 입증했습니다.

arXivAI 번역논문

Latent Causal Void: 오정보 탐지를 위한 명시적 누락 맥락 재구성

기존의 자동 오정보 탐지는 기사에 명시적으로 드러나는 거짓 정보를 잘 포착하지만, 배경 지식이나 생략된 맥락을 통해 오도하는 유형의 오정보에는 취약합니다. 본 논문은 이러한 '누락 관련 설정(omission-relevant setting)'에 초점을 맞춰, 대상 문장에 누락된 사실을 명시적으로 재구성하고 이를 그래프 추론 기반의 교차 출처 관계로 활용하는 검색 가이드형 탐지기인 LCV를 제안했습니다. LCV는 시간 순서로 정렬된 맥락 기사를 검색한 후, LLM에게 각 문장-기사 쌍에 대한 누락 맥락 설명을 생성하게 하고, 이를 이종 그래프 구조에 통합하여 오정보 탐지의 성능을 크게 향상시켰습니다.

arXivAI 번역논문

엔터프라이즈 시스템에 학습된 월드 모델 (World Models)이 필요할까? 역학 (Dynamics) 추론을 위한 컨텍스트의 중요성

월드 모델은 환경의 역학을 학습하여 에이전트가 행동 결과를 예측하게 하지만, 엔터프라이즈 시스템의 경우 역학이 배포 환경과 테넌트별 비즈니스 로직에 따라 끊임없이 변화하는 '배포 시점 변화(deployment shift)' 문제가 발생합니다. 본 연구는 전이 역학이 설정 가능하고 읽을 수 있는 환경에서는 에이전트가 모든 것을 학습할 필요 없이, 추론 시점에 시스템 설정을 읽어 런타임 탐색을 통해 예측을 활성 시스템 인스턴스에 근거하게 함으로써 오프라인 학습의 한계를 보완할 수 있음을 제안합니다. 이를 위해 'CascadeBench'라는 새로운 벤치마크를 도입하여, 설정 가능한 엔터프라이즈 환경에서 에이전트가 고정된 내재적 역학 대신 런타임에 전이 로직을 발견하는 메커니즘을 통합해야 함을 입증했습니다.

arXivAI 번역논문

Large Language Model 품질 평가를 위한 희소 사용자 피드백 내 선택 편향(Selection Bias) 교정: 다중 에이전트

본 연구는 실제 LLM 배포 환경에서 발생하는 선택 편향(selection bias) 문제를 다루며, 사용자 피드백이 무작위가 아닌 특정 비율의 사용자에 집중되는 현상을 분석합니다. 이를 위해 주제 및 감성별로 계층화된 베이지안 파이프라인을 제안하여, 개별 정답 레이블 없이도 편향을 교정하고 시스템 품질을 추론할 수 있습니다. 이 3-에이전트 모델은 실제 데이터셋에서 높은 정확도를 보였으며, 특히 사전 확률(prior)의 도입이 편향 채널 문제를 해결하는 핵심임을 입증했습니다.

arXivAI 번역논문

Dynamic Cognitive Reconciliation Decoding을 통한 LLM의 컨텍스트-메모리 충돌 완화

본 논문은 대규모 언어 모델(LLMs)이 축적한 파라미터 지식과 컨텍스트 내 외부 지식이 충돌할 때 발생하는 '지식 충돌' 문제를 해결하기 위한 새로운 2단계 디코딩 방법인 Dynamic Cognitive Reconciliation Decoding (DCRD)를 제안합니다. DCRD는 어텐션 맵 분석을 통해 컨텍스트 충실도를 평가하고 잠재적 충돌을 예측한 후, 탐욕적 디코딩 또는 컨텍스트 충실도 기반 동적 디코딩 중 적절한 경로로 입력을 유도하여 충돌 처리와 효율성을 동시에 확보합니다. 이 방법은 ConflictKG라는 지식 충돌 QA 벤치마크에서 여러 LLM 대비 최첨단 성능을 달성했습니다.

arXivAI 번역논문

얼마나 많은지가 아니라 어떤 것인가: Low-Rank Adaptation에서의 파라미터 배치

본 논문은 LoRA 어댑터의 파라미터 배치 문제(parameter placement problem)를 다루며, 학습 가능한 엔트리 $k$개의 배치가 성능에 미치는 영향을 분석합니다. 지도 미세 조정(SFT) 환경에서는 무작위 선택과 정보 기반 선택 간 성능 차이가 크지 않지만, GRPO 환경에서는 그래디언트 정보에 기반한 배치가 표준 LoRA의 정확도를 회복하는 것으로 나타났습니다. 이러한 레짐 의존성은 SFT와 GRPO의 그래디언트 구조적 차이(저차원/안정적 vs 고차원/직교)에서 기인합니다.

arXivAI 번역논문

PreScam: 초기 대화를 통한 사기 진행 단계 예측을 위한 벤치마크

본 글은 로맨스 사기나 투자 사기와 같이 다회차 대화를 통해 피해자를 점진적으로 조종하는 '대화형 사기(Conversational scams)'를 탐지하기 위한 새로운 벤치마크인 PreScam을 소개합니다. PreScam은 실제 사기 신고 데이터를 구조화하여, 사기 생애주기에 따라 계층적으로 구성된 대화 사례들을 제공하며, 사기꾼의 심리적 행동과 피해자의 반응이 주석 처리되어 있습니다. 이 벤치마크를 활용하여 연구진들은 실시간 종료 예측 및 사기꾼 행동 예측 두 가지 작업에 대해 모델을 평가했으며, 그 결과 현재 LLM들이 단서 포착은 가능하지만, 위험 고조 과정이나 대화 전반의 조종 과정을 추적하는 데는 한계가 있음을 보여주었습니다.

arXivAI 번역논문

PRISM: 의도 인식 구조화된 메모리(Intent-Aware Structured Memory)를 통한 장기적 에이전트(Long-Horizon

PRISM은 장기적 언어 에이전트가 직면하는 메모리 관리 문제를 해결하기 위해 제안된 학습이 필요 없는(Training-free) 검색 프레임워크입니다. 이 프레임워크는 그래프 구조 메모리를 활용하여 공동 검색 및 압축을 수행하며, 네 가지의 추론 시간 구성 요소를 결합합니다. PRISM은 적응형 의도 라우팅, 계층적 번들 검색 등을 통해 필요한 증거를 효율적으로 찾아내고, 이를 압축된 컨텍스트로 제공함으로써 정확도와 메모리 사용량 측면에서 기존 방식보다 월등한 성능을 보여줍니다.

arXivAI 번역논문

Sparse Autoencoders를 이용한 ASR 모델의 기계론적 해석 가능성 (Mechanistic Interpretability)

본 연구는 Sparse Autoencoders (SAE)를 Transformer 기반 ASR 모델인 Whisper에 적용하여 그 내부 작동 원리를 해석하는 방법을 제시합니다. SAE를 통해 Whisper 인코더에서 추출된 프레임 수준 임베딩을 학습시켜 고차원 희소 잠재 공간을 구축했습니다. 이를 통해 연구진은 언어적 및 비언어적 경계를 아우르는 다양한 단일 의미 특징과 교차 언어 특징 제어를 성공적으로 입증하며, SAE가 ASR 모델 해석에 효과적임을 보여주었습니다.

arXivAI 번역논문

TokenRatio: 비율 매칭(Ratio Matching)을 통한 원칙적인 토큰 수준 선호도 최적화

본 연구는 기존의 DPO(Direct Preference Optimization)가 전체 시퀀스 선호도를 모델링하는 한계를 극복하고, 토큰 수준의 선호도 최적성(token-level preference optimization)을 회복하는 방법을 제시합니다. 이를 위해 'Token-level Bregman Preference Optimization (TBPO)'라는 새로운 프레임워크를 도입했습니다. TBPO는 표준적인 시퀀스 수준 쌍체 비교만을 사용하면서, 토큰별 다음 행동에 대한 선호도 모델을 가정하고 일반화된 목적 함수(Bregman-divergence 밀도 비율 매칭)를 도출합니다. 실험 결과, TBPO는 다양한 벤치마크에서 기존의 강력한 시퀀스 및 토큰 수준 베이스라인 대비 정렬 품질과 학습 안정성을 개선하고 출력 다양성을 증가시키는 성능을 보였습니다.

arXivAI 번역논문

무엇이 단어를 배우기 어렵게 만드는가? 영어 어휘 난이도에 대한 L1(모국어)의 영향 모델링

본 연구는 단어 학습의 어려움을 결정하는 요인과 그 난이도가 학습자의 모국어(L1)에 따라 어떻게 달라지는지 모델링했습니다. 그래디언트 부스팅 모델을 사용하여 스페인어, 독일어, 중국어 사용 영어 학습자를 위한 어휘 난이도를 계산적으로 추정합니다. 분석 결과, 단어 친숙도는 모든 언어에서 중요한 요소였으나, 스페인어와 독일어 사용자에게는 철자 전이가 추가적인 영향을 미쳤고, 중국어 사용자에게는 친숙도와 표면 특징의 조합으로만 난이도가 결정됨을 밝혀냈습니다.

arXivAI 번역논문

MedHopQA: LLM 기반 생물 의학 질의응답을 위한 질병 중심의 멀티홉 추론 벤치마크 및 평가 프레임워크

MedHopQA는 기존 생물 의학 QA 벤치마크의 한계인 단순 패턴 매칭과 데이터 오염 문제를 해결하기 위해 설계된 질병 중심의 멀티홉 추론 벤치마크입니다. 전문가가 선별한 1,000개의 질문-답변 쌍을 통해 여러 문서의 정보를 통합하는 능력을 평가하며, 개방형 자유 텍스트 형식과 온톨로지 기반의 정교한 평가 체계를 제공합니다.

arXivAI 번역논문

GKnow: 성별 편향 (Gender Bias)과 사실적 성별 (Factual Gender)의 얽힘 측정

본 논문은 기존 연구들이 특정 성별 관련 작업에만 집중하거나, 사실적 성별(Factual Gender)과 고정관념 기반의 성별 편향(Gender Bias)을 구분하지 못하는 문제를 지적합니다. 이를 해결하기 위해 다양한 유형의 성별 예측 전반에 걸쳐 언어 모델의 성별 지식과 성별 편향을 평가할 수 있는 벤치마크인 GKnow를 구축했습니다. 실험 결과, 성별 편향과 사실적 성별은 회로 및 뉴런 수준에서 심각하게 얽혀 있어, 단순한 뉴런 절제(Ablation)가 신뢰할 수 있는 편향 제거 방법이 아님을 보여줍니다.

arXivAI 번역논문

문맥 수렴(Context Convergence)이 추론형 질문 답변 능력을 향상시킨다

본 연구는 대규모 언어 모델(LLMs)이 직접 검색보다 도출해야 하는 추론형 질문에 대한 답변 능력을 향상시키는 방법을 탐구했습니다. 특히, 지문 내 문장들이 오답을 효과적으로 제거하는 정도를 측정하는 '수렴도(convergence)'라는 새로운 지표에 주목했습니다. 연구 결과, 높은 수렴도를 가진 문장들로 구성된 지문이 단순히 코사인 유사도로 선택된 지문보다 추론적 질문 답변 정확도가 더 높았으며, 이는 수렴도가 LLM의 의미 있는 관련성을 포착하는 데 중요한 역할을 함을 보여줍니다.

arXivAI 번역논문

BioCreative IX의 MedHopQA 트랙 개요: 다중 홉(multi-hop) 의료 질의응답을 위한 트랙 설명, 참여 및 시스템 평가

BioCreative IX의 MedHopQA 공유 과제는 생물 의학 분야에서 복잡한 다중 홉 질의응답(Multi-hop QA) 능력을 평가하기 위해 설계되었습니다. 이 챌린지는 희귀 질환에 초점을 맞춘 1,000개의 도전적인 QA 쌍으로 구성된 새로운 데이터셋을 사용하며, 두 개의 서로 다른 Wikipedia 페이지에서 정보를 통합하는 2-홉 추론을 요구합니다. 결과적으로, 검색 증강 생성(RAG) 및 관련 검색 기반 전략이 높은 성능을 보이는 데 결정적이었으며, 개념 수준의 평가가 답변 정확도를 개선함을 입증했습니다.

arXivAI 번역논문

사전 학습 노출(Pretraining Exposure)이 대규모 언어 모델(LLMs)의 인기 판단을 설명한다

본 연구는 LLMs가 특정 엔티티에 대해 보이는 '인기 편향'의 원인을 분석하며, 이 선호도가 실제 세계의 인기를 반영하는지 아니면 학습 과정 중의 통계적 노출을 반영하는지 탐구합니다. 공개된 OLMo 모델과 Dolma 코퍼스를 활용하여 7.4조 개의 토큰에 걸쳐 엔티티 수준의 노출 통계를 계산하고, 이를 Wikipedia 조회수 및 LLM 유도 인기 신호와 비교했습니다. 연구 결과, LLMs의 인기 판단은 외부적인 Wikipedia 인기도보다 사전 학습 과정에서의 '노출'과 훨씬 더 강하게 상관관계를 보이며, 이는 데이터 노출이 LLM의 인기 편향을 형성하는 핵심 동인임을 입증합니다.

arXivAI 번역논문

범주적 오류 민감도 지수 (ISEC): 수동 데이터 입력 시스템의 회복 불가능한 오류를 방지하기 위한 서수적 의사결정 지원 지표

본 논문은 특히 중소기업(SMEs)의 마스터 데이터에서 발생하는 범주적 오분류로 인한 회복 불가능한 오류를 방지하기 위한 새로운 지표, '범주적 오류 민감도 지수(ISEC)'를 제안합니다. ISEC는 의미적 거리, 맞춤형 형태 변환 비용, 경험적 빈도를 통합하여 단일하고 수학적으로 견고한 예방적 프레임워크를 구축합니다. 이 지수는 벡터 데이터베이스 아키텍처를 활용하여 계산 효율성을 높였으며, 다양한 산업의 실제 데이터를 통해 그 유효성이 검증되었습니다.

arXivAI 번역논문

Level-Playing-Field 평가 원칙을 사용한 제어된 텍스트 생성 (Controlled Text Generation) 시스템의 비교

본 논문은 제어된 텍스트 생성(Controlled Text Generation, CTG) 시스템을 공정하고 객관적으로 비교 평가할 수 있는 새로운 접근 방식인 Level-Playing-Field (LPF)를 제시한다. LPF는 모든 시스템 출력을 표준화하고 공유된 평가 방법 및 데이터셋 세트를 적용하여 비교의 신뢰성을 높인다. 연구 결과, 기존에 보고된 CTG 시스템들의 성능을 이 방식으로 재평가했을 때 대부분 원래 주장보다 낮은 성능을 보여주었으며, 이는 CTG 분야에서 표준화되고 재현 가능한 평가 관행이 시급히 필요함을 강조한다.

이전14 / 42전체 42페이지 중 14페이지다음