Insights
AI가 자동으로 큐레이션·번역·정리하는 기술 동향 피드입니다.
© 2026 Molayo
AI가 자동으로 큐레이션·번역·정리하는 기술 동향 피드입니다.
본 페이지의 콘텐츠는 AI가 공개된 소스를 기반으로 자동 수집·요약·번역한 것입니다. 원 저작권은 각 원저작자에게 있으며, 각 게시물의 “원문 바로가기” 링크를 통해 원문을 확인할 수 있습니다. 저작권자의 삭제 요청이 있을 경우 신속히 조치합니다.
arXiv cs.CL (NLP) 1795건필터 해제
언어 모델이 문화적 현상을 정량화할 때, 모델과 데이터, 평가 방식이 문화적 현실을 단순히 기록하는 것이 아니라 능동적으로 구성한다는 점을 논합니다. 카렌 바라드의 '행위적 절단' 개념을 통해 모델 설계가 문화적 경계를 획정하는 과정을 분석합니다.
MER-TRANS 2026의 스페인어 쉬운 읽기(Easy-to-Read) 생성 태스크를 위한 HULAT2 시스템을 소개합니다. LangGraph 기반의 멀티 에이전트 워크플로우와 신호 유도형 라우팅을 통해 기존 베이스라인보다 우수한 성능을 입증했습니다.
LLM 에이전트용 스킬 마켓플레이스에서 개별 스킬의 조합으로 발생하는 '암시적 의도'를 탐지하기 위한 SkillFuzz를 제안합니다. 실행 없이도 몬테카를로 트리 탐색을 통해 충돌하는 스킬 조합을 효율적으로 찾아내는 연구입니다.
LLM의 발전으로 인해 NLP 연구의 학술적 중심이 ACL과 같은 전통적인 NLP 컨퍼런스에서 일반 머신러닝(ML) 컨퍼런스로 이동하고 있습니다. 연구 결과, 신진 저자들의 일반 ML 학술 대회 게재 비중이 크게 증가했으며 이는 인용 프리미엄의 영향으로 분석됩니다.
RAG 시스템의 신뢰성을 높이기 위해 미디어 출처의 신뢰성을 평가하는 '미디어 배경 조사(MBC)' 연구를 소개합니다. 기존의 비용 문제와 재현성 한계를 극복하기 위해 200개 미디어 출처를 포함한 공개 지식 저장소인 MEDIAREF를 제안합니다.
LLM의 단일 언어적 한계를 극복하기 위해 문학적 분석 도구를 활용한 문화적 AI 구축 방안을 제안합니다. 비판 이론과 세계 문학 접근 방식을 통해 AI가 다원적 해석과 문화적 소양을 갖출 수 있는 계층적 프레임워크를 다룹니다.
LLM을 활용하여 Linux/bash 명령 응답을 자동 채점하는 연구를 다룹니다. 4단계 인지 분류 체계를 도입하여 GPT, Claude, Gemini 등의 모델 성능을 평가했으며, 루브릭 기반 프롬프팅이 채점 정확도 향상에 핵심임을 입증했습니다.
LLM의 스케일링 법칙이 사회적 시뮬레이션의 충실도를 개선할 수 있는지 연구했습니다. 대부분의 행동 및 의견 모델링은 스케일링에 따라 개선되지만, 종단적 예측이나 저자원 도메인, 특정 인지적 편향 보정에는 한계가 있음을 밝혀냈습니다.
자율 에이전트가 제한된 상호작용 예산 내에서 정책을 반복적으로 개선하는 능력을 평가하는 새로운 벤치마크인 EvoPolicyGym을 소개합니다. 이 시스템은 에이전트의 정책 진화 과정을 궤적 수준에서 진단하여 단순 점수 이상의 심층적인 분석을 제공합니다.
소프트웨어 코드와 테스트의 공동 진화를 평가하기 위한 실행 가능한 라이브 벤치마크인 TestEvo-Bench를 소개합니다. 실제 커밋 히스토리를 기반으로 테스트 생성 및 업데이트 능력을 측정하며, 데이터 누수를 방지하기 위해 주기적으로 업데이트되는 구조를 갖추고 있습니다.
CLIP 기반 시각-언어 모델(LVLM)이 이미지 내 텍스트에 의해 시각적 의미 대신 어휘적 의미에 편향되는 '타이포그래피 공격(TA)' 문제를 분석합니다. 별도의 훈련 없이 기계론적 해석 가능성을 통해 공격의 근원을 식별하고, 어텐션 가중치 조정을 통해 모델의 강건성을 높이는 방법을 제안합니다.
기존 시각-언어 모델(LVLM)의 자기 성찰 과정에서 발생하는 시각적 근거 부족 문제를 해결하기 위해 새로운 강화학습 프레임워크인 VRRL을 제안합니다. VRRL은 궤적 접두사 마스킹과 경험 재생 버퍼를 통해 모델이 잘못된 예측으로부터 효과적으로 회복하고 시각적 근거에 기반해 수정하도록 학습시킵니다.
본 연구는 오디오북 낭독의 음향적 특징이 청취자의 몰입과 조회율에 미치는 영향을 분석합니다. 사전 학습된 오디오 모델을 통해 어조, 속도, 음량 등의 데이터와 소비 데이터 간의 상관관계를 체계적으로 탐구했습니다.
장편 TV 드라마의 복잡한 맥락에서 화자를 정확히 식별하기 위한 새로운 벤치마크와 모델을 제안합니다. 대규모 추론 모델(LRM)을 활용해 시각, 청각, 언어적 단서를 통합함으로써 기존 방식보다 뛰어난 화자 인식 성능을 입증했습니다.
패킷 손실 은닉(PLC) 성능을 높이기 위해 수신된 신호만을 활용하여 모델을 실시간 적응시키는 TTT-PLC 프레임워크를 제안합니다. 별도의 참조 신호 없이도 자기 지도 학습을 통해 각 통화의 특성에 맞춰 모델을 튜닝할 수 있습니다.
확산 언어 모델(DLM)이 내부 잔차 스트림에 확산 타임스텝 정보를 잠재적으로 인코딩하고 있음을 밝힌 연구입니다. 프로빙을 통해 이 신호를 추출하고, 이를 활용해 모델의 노이즈 제거 과정을 제어할 수 있음을 입증했습니다.
본 연구는 백만 토큰 규모의 대규모 코퍼스에서 언어 모델이 수행하는 인컨텍스트 검색 능력을 체계적으로 분석합니다. BlockSearch 아키텍처를 통해 길이 일반화 문제를 해결하고, 어텐션 희석 현상을 극복하기 위한 새로운 조정 기법을 제안합니다.
고위험 시나리오에서 개인 맞춤형 설득을 수행하기 위한 Q-러닝 기반의 대화 정책 선택(DiPS) 프레임워크를 제안합니다. 화재 구조 상황을 가정하여 대화 문맥에 따라 동적으로 설득 전략을 선택하며, 기존 LLM 및 RAG 방식보다 높은 성공률을 입증했습니다.
LLM이 교육적 의도를 정확히 추론할 수 있도록 돕는 새로운 계산 형식론인 APV 프레임워크를 제안합니다. 베이지안 엔진을 통해 교육적 콘텐츠를 식별하며, GPT-4o 및 Claude 3.5 실험 결과 인간의 판단과 매우 높은 상관관계를 보였습니다.
ADVENT는 귀납 논리 프로그래밍(ILP)의 병목 현상인 술어 발명을 해결하기 위해 LLM의 가추적 생성과 Prolog의 연역적 검증을 결합한 새로운 메커니즘을 제안합니다. 이 방식은 의미 있는 보조 술어를 생성하고 지식 풀에 축적하여 태스크 간 재사용성을 높입니다.