Insights
AI가 자동으로 큐레이션·번역·정리하는 기술 동향 피드입니다.
© 2026 Molayo
AI가 자동으로 큐레이션·번역·정리하는 기술 동향 피드입니다.
본 페이지의 콘텐츠는 AI가 공개된 소스를 기반으로 자동 수집·요약·번역한 것입니다. 원 저작권은 각 원저작자에게 있으며, 각 게시물의 “원문 바로가기” 링크를 통해 원문을 확인할 수 있습니다. 저작권자의 삭제 요청이 있을 경우 신속히 조치합니다.
arXiv cs.CL (NLP) 1795건필터 해제
BlockPilot은 확산 기반 투기적 디코딩의 효율성을 높이기 위해 입력 샘플마다 최적의 블록 크기를 예측하는 인스턴스 적응형 정책을 제안합니다. 프리필링 표현을 활용해 최적의 블록 크기를 결정함으로써 추가 오버헤드 없이 추론 속도를 크게 향상시킵니다.
의료 질의응답 성능 향상을 위해 입력 조건에 따라 LoRA의 랭크 차원을 동적으로 조절하는 BiRG-LoRA 방법론을 제안합니다. 이 모델은 임상 지식을 바탕으로 최적의 랭크 원자를 선택하여 매개변수 효율성을 높이면서도 높은 정확도를 달성했습니다.
문서 분류 벤치마크 데이터셋인 RVL-CDIP의 레이블 오류와 테스트-훈련 데이터 중복 문제를 분석하고 이를 수정한 새로운 버전을 제안합니다. 연구 결과, 오류 수정은 정확도를 높이고 중복 제거는 정확도를 낮추지만, OOD 일반화 성능은 크게 향상됨을 확인했습니다.
Bambara 언어를 사용하는 아동의 읽기 능력을 평가하기 위한 오픈 소스 ASR 시스템 구축 연구를 소개합니다. 데이터 수집부터 벤치마크 구축, Soloni 모델 개발 및 교실 검증까지의 엔드 투 엔드 프로세스를 다룹니다.
문맥 및 토큰 수준의 임베딩을 활용하여 문장 재구성 및 번역에 강한 LLM용 워터마킹 체계인 DEW를 제안합니다. 대수적 벡터 공간 연산을 통해 의미론적 변화 속에서도 워터마크 신호를 유지하며 텍스트 품질을 보존합니다.
AutoTrainess는 언어 모델이 스스로 사후 학습(post-training) 과정을 수행하여 모델을 개선할 수 있도록 설계된 에이전트 프레임워크입니다. 인간의 경험을 워크플로와 규칙으로 외재화하여 에이전트가 데이터 준비부터 학습, 평가까지 신뢰성 있게 수행하도록 돕습니다.
LLM의 임상적 추론을 신뢰성 있게 평가하기 위한 인간 참여형 프레임워크인 CLExEval을 제안합니다. 연구 결과, 모델의 장황함 편향, 숨겨진 지식 역설, 추론-출력 불일치 등 주요 실패 패턴을 식별했습니다. 또한 자동화된 평가 방식이 임상적 오류를 과대평가할 위험이 있음을 경고합니다.
저자원 남부 반투어의 음성 인식 성능을 높이기 위해 성조 조건부 커리큘럼 학습 프레임워크를 제안합니다. 하이브리드 난이도 점수와 게이트 어댑터를 활용하여 기존 모델의 높은 오류율 문제를 해결하고자 했습니다.
LLM을 사용자 선호도에 맞게 정렬하기 위해 테스트 시간 스케일링(TTS)을 활용하는 새로운 프레임워크 REAR를 제안합니다. 보상 함수를 질문 관련 요소와 선호도 정보로 분해하여 효율적인 재정렬을 가능하게 하며, 수학 및 시각적 작업에서도 뛰어난 성능을 보입니다.
OLIVE는 음성 SSL을 위한 새로운 프레임워크로, 뷰 증강 마스크 잠재 예측과 파형 재구성을 결합하여 최적화합니다. 이를 통해 신호 수준의 정보 유지와 견고한 문맥적 표현 형성을 동시에 달성합니다.
MaDI-Bench는 관계형 테이블의 엔드투엔드 데이터 통합을 평가하기 위해 제안된 최초의 벤치마크입니다. 스키마 매칭부터 충돌 해결까지 전체 파이프라인을 포괄하며, LLM 기반 파이프라인을 포함한 다양한 시스템의 성능을 검증할 수 있습니다.
ConsumerSim이라는 생성적 인간-환경 반응 프레임워크를 통해 소비자 신뢰 지수(CCI)의 역학을 재구성하는 연구를 소개합니다. 합성 인구와 거시경제 데이터를 활용하여 경제 충격에 따른 소비자 신뢰의 변화를 정밀하게 시뮬레이션합니다.
MOPD는 여러 도메인의 강화학습(RL) 능력을 하나의 LLM으로 통합하기 위한 새로운 사후 학습 패러다임입니다. 학생 모델의 자체 롤아웃을 통해 다중 교사의 능력을 증류함으로써 노출 편향을 제거하고 도메인 간 결합 문제를 해결합니다.
RAG 시스템에서 외부 문맥과 모델 지식이 충돌할 때 발생하는 취약성을 해결하기 위한 RAPS-DA 프레임워크를 제안합니다. 샘플 및 토큰 수준에서 체제를 인식하여 전문화된 피어 전문가를 학습함으로써, 모델 규모를 키우지 않고도 충돌 상황에 강건한 성능을 구현합니다.
현대 중국 시 평가를 위해 LLM이 시인의 관점을 채택하여 평가하는 새로운 방법론인 Poller를 제안합니다. 실험 결과, Poller는 수사 기법 및 낯설게 하기 등 전문적 차원에서 기존 방식보다 인간과의 평가 오차를 획기적으로 줄였습니다.
Transformer 모델의 긴 문맥 효율성을 높이기 위해 전체 어텐션과 선형 어텐션을 결합하는 하이브리드 모델 최적화 연구입니다. FlashMorph라는 새로운 레이어 선택 방법을 제안하여, 예산 제약 내에서 최적의 레이어 구성을 효율적으로 찾아냅니다.
35B MoE 모델인 Agents-A1을 통해 에이전트 지평을 확장하여 조 단위 파라미터급 성능을 달성하는 연구를 소개합니다. 장기 지평 궤적과 이질적 에이전트 능력을 결합한 3단계 학습 레시피를 통해 1T 모델과 대등한 성능을 구현했습니다.
LLM 간의 다회차 대화에서 나타나는 '어트랙터(Attractor)' 현상을 연구한 논문입니다. 모델 간 상호작용 시 특정 모델의 스타일이 다른 모델에게 전이되어 대화가 특정 행동 집합으로 수렴하는 비대칭적 역학을 분석했습니다.
본 연구는 베이지안 의사결정 이론과 위험 회피적 의사결정을 활용하여 LLM의 불확실성 인지 능력을 개선하는 알고리즘을 제안합니다. 튜터링 및 자동 동료 검토 작업에서 일치 예측(conformal prediction)을 통해 출력의 신뢰성을 높이는 방법을 다룹니다.
클래스 불균형 해결을 위한 재표집(Resampling) 기법이 트리 앙상블 모델의 확률 교정(Probability Calibration)에 미치는 영향을 분석한 연구입니다. SMOTE는 영향이 미미하지만, 언더샘플링은 심각한 확률 왜곡을 초래함을 입증했습니다.