본문으로 건너뛰기

Home About Portfolio Blog Insights Resume Contact

Home About Portfolio Blog Insights Resume Contact

© 2026 Molayo

Insights

AI가 자동으로 큐레이션·번역·정리하는 기술 동향 피드입니다.

© 2026. Molayo. All rights reserved.

개인정보 처리방침|이용약관

Home About Portfolio Blog Insights Resume Contact

Home About Portfolio Blog Insights Resume Contact

© 2026 Molayo

Insights

AI가 자동으로 큐레이션·번역·정리하는 기술 동향 피드입니다.

전체 AI Research AI Engineering Claude Code Codex Game Dev Hardware & Silicon Finance & Markets AI Design

이 피드의 글은 AI가 공개된 소스를 자동으로 수집·요약·번역한 것이에요. 저작권 안내를 확인해주세요.

본 페이지의 콘텐츠는 AI가 공개된 소스를 기반으로 자동 수집·요약·번역한 것입니다. 원 저작권은 각 원저작자에게 있으며, 각 게시물의 “원문 바로가기” 링크를 통해 원문을 확인할 수 있습니다. 저작권자의 삭제 요청이 있을 경우 신속히 조치합니다.

이 피드 구독하기

RSSFeedly, Inoreader 등으로 구독

API/api/search?q=검색어

AIllms.txt로 AI 크롤링 가이드

© 2026. Molayo. All rights reserved.

개인정보 처리방침|이용약관

필터arXiv cs.CL836건

arXivAI 번역논문

3,000개 어휘 개념에 대한 중국어 감각운동 및 체화 규범

중국어 만다린어 3,000개 어휘에 대한 감각운동 및 체화 규범 데이터베이스를 구축한 연구입니다. 언어적 표현을 통해 감각운동 정보를 복원할 수 있음을 입증하며, 체화된 인공지능 연구를 위한 비인도-유럽어 자원을 제공합니다.

arXivAI 번역논문

농업 문서 내 저자원 언어의 효과적인 텍스트 임베딩을 위한 청킹 (Chunking) 전략 평가

크메르어 농업 문서를 대상으로 RAG 프레임워크 내 최적의 청킹 전략을 비교 연구했습니다. 재귀적, 크메르어 인식, 문장 기반, LLM 기반 방식 중 300자 크기의 재귀적 청킹이 가장 우수한 성능을 보였습니다.

arXivAI 번역논문

Agentic CLEAR: LLM 에이전트의 다단계 평가 자동화

Agentic CLEAR는 LLM 에이전트의 행동을 시스템, 트레이스, 노드 단위로 자동 평가하는 동적 프레임워크입니다. 기존의 정적이고 수동적인 평가 방식의 한계를 극복하여 고품질의 데이터 기반 피드백을 제공합니다.

arXivAI 번역논문

시를 보다: MLLM을 이용한 AI 생성 현대 중국 시의 이미지-의미론적 탐지

현대 중국 시 탐지를 위해 이미지-의미론적 가이드를 결합한 새로운 MLLM 기반 탐지 방법을 제안합니다. 텍스트와 이미지를 통합하여 시의 의미와 감정을 분석함으로써 기존 RoBERTa 및 텍스트 기반 탐지기보다 뛰어난 성능을 입증했습니다.

arXivAI 번역논문

능력 선택적 부분 공간 투영을 통한 자기 정책 증류 (Self-Policy Distillation via Capability-Selective

외부 신호 없이 모델의 그래디언트와 KV 활성화를 활용해 특정 능력을 선택적으로 학습하는 SPD(Self-Policy Distillation) 기법을 제안합니다. 이 방식은 스타일이나 오류를 배제하고 핵심 능력만을 추출하여 모델의 성능과 일반화 능력을 크게 향상시킵니다.

arXivAI 번역논문

분할 트리(Split Trees)를 이용한 토큰화

ToaST는 재귀적 추론 절차를 통해 압축을 최적화하는 새로운 서브워드 토큰화 방법론입니다. 바이트 n-gram 빈도수를 기반으로 분할 트리를 구성하며, 정수 계획법을 통해 토큰 수를 최소화하는 최적의 어휘 사전을 생성합니다.

arXivAI 번역논문

AnyMo: 야생 환경에서의 기하학 인지형 설정 불가지론적 인간 동작 모델링

AnyMo는 센서 위치나 하드웨어 설정에 구애받지 않는 기하학 인지형 인간 동작 모델링 프레임워크입니다. 물리 기반 시뮬레이션과 LLM 정렬 기술을 통해 제로샷 활동 인식 및 동작 캡셔닝에서 뛰어난 성능을 입증했습니다.

arXivAI 번역논문

음향 감정 인식을 넘어: LLM 기반 및 음향 감정 모델을 이용한 정치 연설의 멀티모달 파토스 (Pathos) 분석

정치 연설의 파토스(Pathos) 분석을 위해 음향 감정 인식 모델과 LLM 기반 멀티모달 분석의 성능을 비교 연구했습니다. Gemini 2.5 Flash를 활용한 분석이 음향 모델보다 정치적 감정을 더 정확하게 포착함을 입증했습니다.

arXivAI 번역논문

ChronoMedKG: 임상 추론을 위한 시간적 근거 기반 생물 의학 지식 그래프 및 벤치마크

임상 추론의 핵심인 시간적 정보를 반영한 생물 의학 지식 그래프 ChronoMedKG와 벤치마크 ChronoTQA를 제안합니다. 기존 KG의 한계를 넘어 질병의 발병 시기와 진행 단계를 포함하며, LLM의 시간적 추론 능력을 크게 향상시킵니다.

arXivAI 번역논문

독일 법전 청킹 (Chunking)

본 논문은 독일 민법을 활용하여 RAG(Retrieval-Augmented Generation) 시스템을 위한 다양한 청킹(Chunking) 전략의 성능을 비교 분석합니다. 연구 결과, 복잡한 LLM 기반 기술보다 법률의 고유한 구조인 조항(section)과 항(subsection)을 보존하는 방식이 재현율과 계산 효율성 측면에서 가장 우수한 성능을 보였습니다.

arXivAI 번역논문

LP-Eval: 법률 명제 생성 품질 측정을 위한 루브릭 및 데이터셋

본 논문은 LLM을 활용하여 유럽연합 사법재판소 판결문으로부터 법률 명제를 자동 생성하고 평가하는 방법론을 제안합니다. 법률 전문가와 공동 설계한 3단계 평가 루브릭인 LP-Eval과 100개의 전문가 주석이 포함된 데이터셋을 공개하며, LLM의 법률 명제 생성 능력과 평가자로서의 성능을 분석합니다.

arXivAI 번역논문

프롬프트에서 포장도로까지: 에이전트 기반 Scene-to-Plan 추론에서의 시계열적 접지 (Temporal Grounding)

본 연구는 자율 주행 자동차의 장면 해석 및 계획 과정에서 LLM/LMM이 시계열적 맥락을 간과하여 발생하는 추론 불일치 문제를 다룹니다. 연구진은 시계열적 조건화(Temporal Conditioning)를 도입한 세 가지 플래너 아키텍처를 제안하고 BDD-X 데이터셋을 통해 이를 평가했습니다. 실험 결과, 정량적 지표의 큰 개선은 없었으나 질적 분석을 통해 예측적 위험 추론 및 안정적인 교정 동작과 같은 유의미한 행동 변화를 확인했습니다.

arXivAI 번역논문

Mega-ASR: 실제 환경의 복합적 음향 시뮬레이션 확장을 통한 야생(In-the-wild^2) 음성 인식 연구

Mega-ASR은 실제 환경의 복합적인 음향 왜곡 상황에서도 견고한 음성 인식을 수행하기 위해 제안된 통합 프레임워크입니다. 54가지 복합 시나리오를 포함하는 Voices-in-the-Wild-2M 데이터셋과 점진적 음향-의미 최적화 학습 방식을 통해, 기존 모델들이 겪는 음향적 강건성 병목 현상을 해결합니다. 실험 결과, 열악한 환경의 벤치마크에서 기존 SOTA 시스템 대비 월등한 성능과 30% 이상의 WER 감소를 입증했습니다.

arXivAI 번역논문

CADENet: 자율 주행의 악천후 인지를 위한 조건 적응형 비동기 이중 스트림 강화 네트워크

CADENet은 악천후 상황에서 자율 주행 차량의 객체 탐지 성능을 높이기 위해 제안된 학습 불필요(training-free) 방식의 비동기 이중 스트림 네트워크입니다. 기존의 강화 후 탐지 방식이 가진 실시간성 저하 문제를 해결하기 위해, 탐지(Thread S), 강화(Thread Q), 날씨 분류(Thread E)를 분리된 스레드로 처리하여 지연 시간을 최소화합니다. 또한, 데이터 주석의 불완전성으로 인한 평가 한계를 지적하며 재현율(Recall)을 핵심 지표로 제시합니다.

arXivAI 번역논문

FineBench: 미세한 인간 행동 이해를 위한 시각-언어 모델 (VLM) 벤치마킹 및 강화

FineBench는 긴 형식의 비디오에서 인간의 미세한 행동, 상호작용, 사물 조작을 정밀하게 이해하기 위해 설계된 새로운 VQA 벤치마크입니다. 연구 결과, GPT-5와 같은 폐쇄형 모델은 준수한 성능을 보였으나 오픈 소스 VLM은 복잡한 장면에서의 공간적/시간적 추론에 한계를 보였습니다. 이를 해결하기 위해 로컬라이저와 디스크립터를 활용하여 VLM의 성능을 높이는 모듈형 프레임워크인 FineAgent를 제안합니다.

arXivAI 번역논문

CLIF: 투명한 Bottleneck 모델을 위한 개념 수준의 영향 함수 (Concept-Level Influence Functions)

딥러닝 모델의 블랙박스 문제를 해결하기 위해 샘플 및 개념 수준에서 영향 함수를 활용하는 새로운 접근 방식인 CLIF를 제안합니다. 이 방식은 훈련 샘플의 레이블과 가중치를 조정하여 재학습 없이 모델 성능을 복구할 수 있으며, Concept Bottleneck Models(CBM) 내의 핵심 개념을 식별하여 모델의 의사 결정 과정을 투명하게 만듭니다.

arXivAI 번역논문

도구가 항상 유익할까? 이중 모드 멀티모달 LLM 추론을 위한 적응형 도구 호출 학습

기존의 멀티모달 거대 언어 모델(MLLM) 연구가 도구 호출 능력에만 집중한 것과 달리, 본 연구는 불필요한 도구 호출로 인한 오버헤드와 오류 문제를 지적합니다. 이를 해결하기 위해 쿼리 특성에 따라 도구 사용 여부를 적응적으로 결정하는 AutoTool 프레임워크를 제안하며, 강화학습을 통해 텍스트 중심 추론과 도구 보조 추론 사이의 균형을 맞춥니다.

arXivAI 번역논문

인코더 기반 언어 모델에서 저자 신호는 어디에서 나타나는가?

동일한 인코더와 데이터를 사용하더라도 점수 산출 방식(scoring mechanism)에 따라 저자 식별 성능이 최대 4배까지 차이 날 수 있음을 밝힙니다. 기계론적 해석 가능성 도구를 통해 분석한 결과, 이러한 성능 격차는 표현 품질이 아닌 점수 산출기가 인코더의 어느 레이어에서 저자 신호를 통합할지 결정하는 방식에서 기인합니다.

arXivAI 번역논문

PEEK: 긴 문맥(Long-Context) LLM 에이전트를 위한 방향성 캐시로서의 문맥 맵 (Context Map)

PEEK는 긴 문맥을 가진 LLM 에이전트가 외부 문맥에 대한 방향성 지식을 효율적으로 재사용할 수 있도록 돕는 '문맥 맵(Context Map)' 시스템입니다. 이 시스템은 증류기, 지도 제작자, 제거기라는 세 가지 모듈을 통해 문맥 정보를 구조화된 캐시로 유지하며, 반복적인 작업에서 비용을 절감하고 성능을 향상시킵니다. 실험 결과, PEEK는 기존 프레임워크 대비 반복 횟수와 비용을 크게 줄이면서도 높은 정확도를 보여주었습니다.

arXivAI 번역논문

LLM은 과학적 의사소통에 어떤 영향을 미치고 있는가? 글쓰기 관행과 독서 경험의 변화 측정

본 연구는 LLM의 사용 증가가 과학적 의사소통 스타일, 즉 글쓰기 관행과 독서 경험에 미치는 영향을 분석합니다. ACL Anthology 논문 데이터와 합성 데이터셋을 통해 분석한 결과, LLM은 특정 통사 구조를 빈번하게 사용하고 어휘 다양성은 낮추는 경향이 있으며, 전문가들은 LLM이 개선한 텍스트를 더 이해하기 쉽다고 느끼면서도 동시에 부정적인 태도를 보이는 등 주관적인 반응을 나타냈습니다.

이전2 / 42전체 42페이지 중 2페이지다음