본문으로 건너뛰기

© 2026 Molayo

Insights

AI가 자동으로 큐레이션·번역·정리하는 기술 동향 피드입니다.

arXiv cs.CL 292필터 해제

arXiv논문

Aggregate vs. Personalized Judges in Business Idea Evaluation: Evidence from Expert Disagreement

본 논문은 비즈니스 아이디어 평가는 다차원적이고 전문가 간 의견이 상충하는 특성을 가지므로, 자동 평가자(judge)를 설계할 때 집합적 합의(aggregate consensus)에 의존할지 개별 평가자를 모델링할지에 대한 방법론적 질문을 탐구합니다. 연구진은 300개의 특허 기반 제품 아이디어를 대상으로 전문가들이 부여한 상세 점수 데이터셋(PBIG-DATA)을 구축했습니다. 분석 결과, 세분화된 영역에서는 높은 불일치가 관찰되었으나, 구조적인 이질성이 존재함을 확인했습니다. 최종적으로, 개별 평가자의 점수 기록에 조건화된 '개인화 평가자(personalized judge)'가 집합적 합의를 따른 '집합적 평가자(aggregate judge)'보다 해당 전문가와 더 높은 일치도를 보이며, 비즈니스 아이디어 평가에는 개인화된 접근 방식이 효과적임을 입증했습니다.

llm-evaluationbusiness-ideasexpert-disagreement
4월 27일3
arXiv논문

MathDuels: LLM 을 문제 제시자와 해결자로 평가하기

MathDuels는 LLM의 능력을 단순히 고정된 문제집을 푸는 해결자(solver)로만 평가하는 기존 방식의 한계를 극복하기 위해 개발된 새로운 자기 대결 벤치마크입니다. 이 벤치마크는 모델에게 수학 문제를 제시하는 '문제 제시자(poser)'와 다른 참가자가 만든 문제를 푸는 '해결자(solver)'라는 두 가지 역할을 동시에 수행하게 합니다. 실험 결과, 문제 제시 능력과 해결 능력은 서로 독립적인 능력이며, MathDuels를 통해 이러한 분리된 능력을 효과적으로 측정할 수 있음을 입증했습니다.

llmevaluationbenchmarking
4월 27일4
arXiv논문

대규모 언어 모델의 비문자적 기억 연구 재검토: 엔티티 표면 형태의 역할

본 논문은 대규모 언어 모델(LLMs)의 사실 지식 기억 방식을 분석하며, 기존 엔티티 기반 QA 프레임워크가 가진 한계를 지적합니다. 연구진은 위키백과 리디렉트 정보를 활용하여 다양한 표면 형태를 포함하는 새로운 데이터셋 RedirectQA를 제안했습니다. 실험 결과, LLMs는 엔티티의 이름(표면 형태)이 조금만 바뀌어도 예측 결과가 달라지는 '일관성 부재'를 보였으며, 이는 모델이 철자 변이보다는 별칭이나 약어 같은 큰 어휘적 변화에 더 취약함을 시사합니다.

llmsqa-systemsknowledge-graph
4월 27일3
arXiv논문

통합 시간적 적응을 위한 지식 기반 증강 및 검색 (KARITA)

본 논문은 모델 배포 환경에서 발생하는 근본적인 문제인 '시간적 변화'에 대응하기 위해 KARITA(Knowledge-driven Augmentation and Retrieval for Integrative Temporal Adaptation)라는 새로운 프레임워크를 제안합니다. KARITA는 지식 기반의 증강 및 검색 메커니즘을 통합하여, 의미 분포와 도메인 지식이 진화하는 시간적 변화(예: 특징 이동, 불확실성)를 포착하고 활용할 수 있습니다. 임상, 법률, 과학 등 다양한 도메인의 분류 작업에서 KARITA가 기존 방법론 대비 일관되고 효과적인 성능 개선을 입증했습니다.

temporal-adaptationknowledge-graphretrieval-augmented-learning
4월 27일4
arXiv논문

LoRA 는 어디에 배치해야 할까? 하이브리드 언어 모델에서의 컴포넌트 유형 배치

이 연구는 주의 메커니즘과 순환 구성 요소를 결합한 하이브리드 언어 모델에 대한 최적의 LoRA(저랭크 어댑터) 배치 전략을 제시합니다. 기존의 균일한 LoRA 적용 방식 대신, 컴포넌트 유형별 특성을 고려하여 적응하는 것이 중요함을 보여줍니다. 연구 결과, 주의 경로에만 LoRA를 집중적으로 적용했을 때 전체 모델 대비 훨씬 적은 파라미터로도 일관되게 우수한 성능을 달성했으며, 하이브리드 아키텍처의 토폴로지(순차형/병렬형)가 적응 방식과 전이 학습 결과에 결정적인 영향을 미친다는 것을 입증했습니다.

lorahybrid-modelsllm-adaptation
4월 27일4
arXiv논문

괄호 순서 변환기에서 해석 가능성과 인과적 사용을 분리하기

본 논문은 트랜스포머 모델에서 학습된 계층 구조가 단순히 '해석 가능한(decodable)' 것인지, 아니면 실제로 '인과적으로 사용되는(causally used)' 것인지를 조사합니다. 연구진은 명시적인 Dyck 언어(균형 잡힌 괄호 순서)로 학습된 트랜스포머를 사용하여 잔류 스트림과 주의 패턴을 탐지하고 개입하는 실험을 수행했습니다. 그 결과, 깊이와 거리 같은 계층적 정보는 모두 해석 가능하지만, 인과적인 역할은 분리되어 있음을 발견했으며, 특히 스택 상단 위치의 주의를 가리는 것이 장거리 정확도에 큰 영향을 미치는 반면, 저차원 잔류 스트림을 제거하는 것은 상대적으로 적은 영향을 미친다는 것을 보여주었습니다.

transformerscausalityinterpretability
4월 27일3
arXiv논문

SHAPE: 교육용 LLM의 안전성, 유익성 및 교수법을 통합하는 방법

본 논문은 교육용 대형 언어 모델(LLM)이 가진 '교수법적 잼브레이크'라는 치명적인 취약점을 식별하고 이를 해결하기 위한 프레임워크를 제안합니다. 연구진은 안전성, 유익성, 교수법을 통합하는 지식 숙달 그래프 기반의 SHAPE 벤치마크를 구축했습니다. 이와 함께, 문제 해결 과정에서 학생의 학습 격차를 파악하고 적절한 지시를 제공하며 생성 경로를 전환하는 그래프 강화 튜터링 파이프라인을 제시하여 LLM의 교육적 효과와 안전성을 동시에 향상시키는 방법을 입증했습니다.

llmeducation-aipedagogy
4월 27일4
arXiv논문

언어 모델의 공유 문법적 메커니즘에 대한 세밀한 분석

본 연구는 언어 모델의 문법적 능력이 언어학적 원리와 어떻게 연결되는지 가원성 해석 가능성 방법론을 사용하여 분석했습니다. 특히 필러-갭 의존성과 NPI 처리 메커니즘에 초점을 맞추었으며, 초기/중간 층에서 국소화되고 공유된 신경 메커니즘이 존재함을 발견했습니다. 또한, 이러한 메커니즘이 일반화 가능성을 가지지만, 특정 해석 방법론은 좁은 분포에서 과적합될 위험이 있음을 입증하고, 식별된 구성 요소 조작을 통해 모델 성능 개선을 검증했습니다.

language-modelsinterpretabilitysyntax
4월 27일4
arXiv논문

Behavioral Canaries: RL Fine-Tuning 에서의 사적 검색 컨텍스트 사용 감사

본 기사는 LLM 기반 에이전트 워크플로우에서 법적으로 보호되는 추가 학습 데이터가 서비스 약관을 위반하여 포함되었는지 감사하는 새로운 방법론인 'Behavioral Canaries'를 소개합니다. 기존의 암기 및 멤버십 추론 기반 감사는 강화학습(RL)으로 훈련된 모델에는 효과적이지 않다는 한계가 있었습니다. Behavioral Canaries는 문서 트리거와 독특한 스타일적 응답에 보상을 주는 피드백을 사용하여 잠재적인 조건부 선호도 데이터를 장비하고, 이를 통해 RLFT 파이프라인에서 무단 데이터 포함 여부를 감지할 수 있습니다.

llm-auditingrlftbehavioral-canaries
4월 27일2
arXiv논문

대형 언어 모델이 내부 지식과 사용자 및 문서 주장을 어떻게 균형 잡는가

대형 언어 모델(LLMs)이 내부 지식, 사용자 주장, 검색된 문서 등 여러 출처의 정보를 효과적으로 통합하고 균형을 맞추는 것이 시스템 안전성에 매우 중요합니다. 기존 연구는 이러한 다중 출처 상호작용 환경을 충분히 고려하지 못했기 때문에, 본 논문은 세 가지 출처 상호작용 프레임워크를 제안하고 광범위한 실험을 수행했습니다. 그 결과, 대부분의 LLM이 문서 주장을 사용자 주장보다 더 신뢰하는 경향과 외부 정보 구별 능력의 부족을 발견했으며, 이를 개선하기 위해 다양한 출처 상호작용 데이터에 대한 미세 조정(fine-tuning)의 필요성을 제시합니다.

llmsragknowledge-conflict
4월 27일2
arXiv논문

TTS-PRISM: 세밀한 진단을 위한 지각적 추론 및 해석 가능한 음성 모델

TTS-PRISM은 생성형 텍스트-투-스피치(TTS) 모델의 세밀한 음향 결함을 진단하고 지각적 성능을 해석하기 위해 설계된 다차원 진단 프레임워크입니다. 이 프레임워크는 안정성부터 고급 표현력까지 아우르는 12차원 스키마를 구축하고, 적대적 교란 및 전문가 앵커를 활용하여 고품질의 진단 데이터셋을 생성합니다. 실험 결과, TTS-PRISM은 일반적인 모델보다 인간 정렬 측면에서 우수한 성능을 보이며, 다양한 TTS 패러다임에 대한 직관적인 진단 플래그를 제공합니다.

ttsspeech-synthesisaudio-analysis
4월 27일4
arXiv논문

대형 언어 모델은 조기에 결정하고 이후에 설명한다

본 논문은 대형 언어 모델(LLM)이 긴 추론 과정에서 최종 답변을 언제 결정하는지 분석하고, 이 과정의 비효율성을 지적합니다. 연구 결과에 따르면, LLM의 예측된 답변은 쿼리의 약 32% 시점에서 이미 안정화되며, 이후 생성되는 많은 토큰들은 사후 설명에 불과하여 비용만 증가시킵니다. 이에 따라, 답변이 안정화되자마자 생성을 중단하는 '조기 중단(early stopping)' 전략을 제안하고, 이를 통해 상당한 추론 자원 절감 효과를 입증했습니다.

large-language-modelsinference-efficiencychain-of-thought
4월 27일4
arXiv논문

꼬리 분포 격차 해소: 다단계 패러프레이즈 주입을 통한 견고한 검색 증강 관계 완성

본 논문은 대규모 언어 모델(LLMs)이 정보 추출이나 희소한 관계 완성에 어려움을 겪는 문제를 해결하기 위해 'RC-RAG'라는 다단계 패러프레이즈 가이드 관계 완성 프레임워크를 제안합니다. RC-RAG는 검색 단계와 생성 단계 모두에 체계적인 패러프레이즈 통합을 통해 관계의 어휘적 범위를 확장하고 추론 과정을 안내하여, 모델 미세 조정 없이도 높은 성능을 달성하는 것이 특징입니다. 실험 결과, 특히 꼬리 분포(long-tail) 설정에서 기존 RAG 베이스라인 대비 현저히 우수한 성능 향상을 입증했습니다.

llmsragrelationship-completion
4월 27일4
arXiv논문

STEM: 지식 그래프 기반 검색 증강 생성을 위한 구조 추적 증거 발굴

본 논문은 지식 그래프 기반 질문 답변(KGQA)이 직면한 구조적 이질성과 전역적 관점 부족 문제를 해결하기 위해 Structure-Tracing Evidence Mining (STEM)이라는 새로운 프레임워크를 제안합니다. STEM은 KG의 구조적 사전 지식을 활용하여 쿼리를 분해하고 적응형 스키마 그래프를 구축하는 파이프라인을 설계했습니다. 또한, Triple-GNN과 Global Guidance Subgraph를 도입하여 전역적인 구조 정보를 통합함으로써, 다중 홉 추론 검색의 정확도와 증거 완전성을 크게 향상시키는 데 성공했습니다.

knowledge graphqagraph neural network
4월 27일4
arXiv논문

CLARITY: 대화형 NL2SQL 시스템에서의 언어 모호성과 답변 불가능성을 위한 프레임워크 및 벤치마크

Clarity는 대화형 자연어-SQL(NL2SQL) 시스템의 현실적인 실패 시나리오를 다루기 위해 설계된 새로운 프레임워크이자 벤치마크입니다. 이 프레임워크는 단일 및 다중 턴 설정에서 다양한 모호성과 사용자 행동을 가진 NL2SQL 쿼리를 자동으로 생성합니다. 실험 결과, 기존 선도 시스템들은 복합적인(다면적) 모호성 하에서 성능이 크게 저하되며, 단순히 모호성을 감지하는 것을 넘어 근본적인 도식 수준의 원인을 파악하고 해결하는 데 어려움을 겪는 것으로 나타났습니다.

nl2sqldialogue-systemambiguity
4월 27일2
arXiv논문

Context-Fidelity Boosting: Watermark-Inspired Decoding 를 통한 Faithful Generation 강화

본 논문은 대규모 언어 모델(LLMs)이 입력 컨텍스트와 모순되는 정보를 생성하는 '충실도 환각(faithfulness hallucination)' 문제를 해결하기 위한 경량 디코딩 시간 프레임워크인 Context-Fidelity Boosting(CFB)을 제안합니다. CFB는 워터마킹 기술에서 영감을 받은 로짓 조정 원리를 활용하여, 입력 컨텍스트로부터의 지원 정도에 따라 토큰 단위로 가산 편향을 적용함으로써 모델이 소스 기반의 정보를 더 충실하게 따르도록 유도합니다. 이 방법은 재학습이나 아키텍처 변경 없이 다양한 LLM에 쉽게 적용 가능하며, 여러 작업에서 높은 성능 향상을 입증했습니다.

llmsdecoding-timehallucination
4월 27일3
arXiv논문

대규모 언어 모델 내의 선호도 헤드: 해석 가능한 개인화를 위한 기계론적 프레임워크

본 연구는 대규모 언어 모델(LLMs)의 암묵적인 개인화 능력을 해석 가능한 방식으로 제어하기 위한 'Differential Preference Steering (DPS)'라는 새로운 프레임워크를 제안합니다. 기존 방식들이 블랙박스에 의존했던 것과 달리, DPS는 LLM 내부에 사용자 선호도를 인코딩하는 희소한 'Preference Heads'가 존재한다고 가정하고 이를 식별합니다. 이 프레임워크는 훈련 과정 없이(training free) 추론 시점에 특정 헤드를 조작하여 사용자의 스타일이나 주제에 맞는 개인화된 출력을 생성하며, 높은 해석 가능성과 낮은 계산 오버헤드를 동시에 달성함을 입증했습니다.

llmsmechanistic-interpretabilitypersonalization
4월 27일3
arXiv논문

글로스 프리 손어 번역을 위한 선택적 대조 학습

본 논문은 글로스 프리(gloss-free) 환경에서의 손어 번역(SLT)의 어려움을 다루며, 기존 시스템들이 사용하는 무작위 인-배치 대조 학습 방식의 한계를 지적합니다. 연구진은 음성 영상과 텍스트 간의 유사도 역학 분석을 통해, 임의로 선택된 음성 샘플이 일관적인 정렬 정보를 제공하지 못한다는 것을 발견했습니다. 이에 따라, 참조 체크포인트 기반의 점수화와 커리큘럼 학습을 결합한 '선택적 대조 학습(SCL-SLT)' 및 '페어 선택(PS)' 전략을 제안하여, 노이즈를 줄이고 효과적인 대조적 지도 정보를 강화하는 방법을 제시합니다.

sign-language-translationcontrastive-learningselective-attention
4월 27일4
arXiv논문

SSG: LLM 워터마킹을 위한 로그트 균형형 어휘 분할

본 논문은 LLM이 생성한 콘텐츠의 저자성 추적을 위한 워터마킹 기술을 다루며, 특히 기존 방법(KGW)이 엔트로피가 낮은 환경에서 성능이 저하되는 문제를 해결하고자 합니다. 연구진은 '워터마킹 강도'라는 개념을 정의하고, 이를 높이기 위해 어휘 분할 알고리즘을 재설계한 SSG(Sort-then-Split by Groups) 방법을 제안합니다. 이 방법은 어휘를 두 개의 로그트 균형형 부분집합으로 나누어 각 토큰 예측의 워터마킹 강도 하한을 높임으로써, 코드 생성 및 수학적 추론과 같은 까다로운 환경에서도 워터마킹 탐지성을 향상시킵니다.

llm-watermarkingnatural-language-processingvocabulary-splitting
4월 27일2
arXiv논문

대형 언어 모델의 숨겨진 무작위성을 특성화하기 위한 배경 온도 도입

대규모 언어 모델(LLMs)은 이론적으로 온도를 0으로 설정해도 입력에 따라 다른 출력을 생성하는 비결정론적 문제를 안고 있습니다. 이 논문은 이러한 구현 의존적인 변동성을 '배경 온도($T_{bg}$)'라는 개념을 도입하여 공식화합니다. 연구진은 $T_{bg}$가 추론 환경에서 발생하는 확률적 섭동과 관련됨을 보여주고, 이를 측정하기 위한 실증 프로토콜을 제안하며 재현성 및 평가에 대한 중요한 함의를 제시합니다.

llmsrandomnessdeterminism
4월 27일1

이 피드 구독하기

본 페이지의 콘텐츠는 AI가 공개된 소스를 기반으로 자동 수집·요약·번역한 것입니다. 원 저작권은 각 원저작자에게 있으며, 각 게시물의 “원문 바로가기” 링크를 통해 원문을 확인할 수 있습니다. 저작권자의 삭제 요청이 있을 경우 신속히 조치합니다.