본문으로 건너뛰기

Home About Portfolio Blog Insights Resume Contact

Home About Portfolio Blog Insights Resume Contact

© 2026 Molayo

Insights

AI가 자동으로 큐레이션·번역·정리하는 기술 동향 피드입니다.

© 2026. Molayo. All rights reserved.

개인정보 처리방침|이용약관

Home About Portfolio Blog Insights Resume Contact

Home About Portfolio Blog Insights Resume Contact

© 2026 Molayo

Insights

AI가 자동으로 큐레이션·번역·정리하는 기술 동향 피드입니다.

전체 AI Research AI Engineering Claude Code Codex Game Dev Hardware & Silicon Finance & Markets AI Design

이 피드의 글은 AI가 공개된 소스를 자동으로 수집·요약·번역한 것이에요. 저작권 안내를 확인해주세요.

본 페이지의 콘텐츠는 AI가 공개된 소스를 기반으로 자동 수집·요약·번역한 것입니다. 원 저작권은 각 원저작자에게 있으며, 각 게시물의 “원문 바로가기” 링크를 통해 원문을 확인할 수 있습니다. 저작권자의 삭제 요청이 있을 경우 신속히 조치합니다.

이 피드 구독하기

RSSFeedly, Inoreader 등으로 구독

API/api/search?q=검색어

AIllms.txt로 AI 크롤링 가이드

© 2026. Molayo. All rights reserved.

개인정보 처리방침|이용약관

필터arXiv cs.CL836건

arXivAI 번역논문

사용자 디지털 흔적(Digital Traces)으로부터 우울 상태 변화의 설명 가능한 탐지

본 연구는 사용자가 생성하는 디지털 흔적(소셜 미디어 게시물, 채팅 등)을 활용하여 우울 상태의 변화를 탐지하고 분석하기 위한 설명 가능한 프레임워크를 제안합니다. 이 프레임워크는 여러 BERT 기반 모델을 결합하여 감성, 감정, 우울증 심각도 등 다양한 차원의 신호를 추출하고 이를 시간적 궤적으로 구축합니다. 특히 LLM을 통합하여 변화 지점과 정신 건강 신호의 진화를 설명하는 사람이 읽기 쉬운 보고서를 생성함으로써 해석 가능성을 높입니다.

arXivAI 번역논문

Scientific Contribution Graph: 대규모 문헌 기반의 자동화된 기술 로드맵 작성

본 논문은 학술 논문에서 과학적 기여를 추출하고 이를 선행 조건과 연결하여 기술 로드맵 작성을 자동화하는 방법을 제시합니다. 23만 개의 오픈 액세스 논문을 기반으로 200만 개의 과학적 기여와 1,250만 개의 선행 조건 엣지를 포함하는 대규모 그래프 리소스인 Scientific Contribution Graph를 구축했습니다. 이 그래프는 과학적 선행 조건 예측 작업을 통해 미래의 발견을 가능하게 하는 기존 기술을 예측하고, 과학적 영향력 평가 및 자동화된 과학적 발견에 활용될 수 있습니다.

arXivAI 번역논문

무작위로 선택된 Few-Shot 가이드를 통한 검증 가능한 보상 기반 강화학습 (Reinforcement Learning with

본 논문은 대규모 언어 모델(LLMs) 개발에 활용되는 검증 가능한 보상 기반 강화학습(RLVR)의 샘플 효율성 문제를 다룹니다. 기존 연구들이 제안한 지도 미세 조정(SFT) 방식이 많은 데이터를 필요로 하는 한계를 극복하기 위해, 저자들은 Few-Shot 데모 가이드 기반 RLVR 알고리즘인 FEST를 제안했습니다. FEST는 무작위로 선택된 소수의 데모만으로도 강력한 성능을 달성하며, 이는 적은 데이터로 높은 효율성을 보여줍니다.

arXivAI 번역논문

COTCAgent: 확률적 사고의 사슬 완성을 통한 예방적 상담

본 연구는 종단적 전자 건강 기록(EHR) 분석에서 발생하는 LLM의 통계적 추론 및 장기 시간 의존성 포착의 한계를 극복하기 위해 COTCAgent라는 계층적 추론 프레임워크를 제안합니다. 이 에이전트는 시계열-통계 어댑터(TSA), 사고의 사슬 완성(COTC) 계층, 유계 완성 모듈로 구성되어 통계 계산과 언어 생성을 분리하여 엄격하고 신뢰할 수 있는 임상 추론을 가능하게 합니다. 실험 결과, COTCAgent는 기존 모델 대비 높은 정확도를 보여 의료 분야에서의 활용 잠재력을 입증했습니다.

arXivAI 번역논문

교육 평가 설계를 위한 팀원으로서의 작고 프라이빗한 언어 모델

본 연구는 교육 평가 설계를 위해 LLMs와 SLMs의 성능을 체계적으로 비교합니다. 특히 Bloom's taxonomy 수준에 걸친 생성 품질과 신뢰도를 분석하여, 모델 기반 판정(model-based judging)이 전문가 평가 대비 보이는 불일치 및 편향을 탐구했습니다. 연구 결과, SLMs는 개인정보 보호를 유지하면서도 교육학적 관점에서 경쟁력 있는 성능을 보여주었으며, 이는 언어 모델을 자동화된 보조자로서 활용하고 Human-in-the-Loop 접근 방식을 강화할 필요성을 시사합니다.

arXivAI 번역논문

장면에서 요소로: 검증 가능한 멀티모달 RAG를 위한 다중 입도 증거 검색

기존 멀티모달 RAG 시스템은 전체 장면(coarse granularity) 단위로 증거를 검색하여, 세밀한 사용자 질의에 대한 불일치나 실패 원인 검증이 어렵다는 한계가 있습니다. 본 논문에서는 개별 이미지가 엔티티의 부분 관찰 문제를 해결하기 위해 GranuVistaVQA라는 요소 수준 주석 기반 멀티모달 벤치마크를 제시합니다. 또한, 시각적 요소를 일급 검색 단위로 취급하는 다중 입도 프레임워크인 GranuRAG를 제안하며, 이를 통해 투명한 오류 진단과 높은 성능 향상을 달성했습니다.

arXivAI 번역논문

Vision Language Models에서의 문화적 시대착오 및 시간적 추론에 대하여

본 연구는 Vision-Language Models (VLMs)가 문화유산 자료를 해석할 때 발생하는 '문화적 시대착오(cultural anachronism)' 문제를 식별하고, 이를 정량적으로 평가하기 위한 벤치마크인 TAB-VLM을 제안합니다. 이 벤치마크는 선사시대부터 현대까지의 인도 문화 유물 1,600개를 대상으로 시간적 추론 능력을 측정하며, 최첨단 모델들조차 낮은 정확도를 보여 VLM이 역사적 맥락 이해에 중대한 한계를 가지고 있음을 입증합니다.

arXivAI 번역논문

AI는 자신이 관찰되고 있음을 인지하는가: 대규모 언어 모델(LLMs)에서의 기능적 전략 행동 및 맥락적 레지스터 변조

본 연구는 대규모 언어 모델(LLMs) 기반 다중 에이전트 시스템이 사회적 관찰 맥락 변화에 따라 어떻게 언어적으로 적응하는지 실험적으로 조사했습니다. Habermas, Goffman 등의 이론을 바탕으로 모니터링 조건과 자동화된 AI 감사 시스템 등 다양한 관찰자 프레이밍 하에서 LLM의 토론 세션을 진행하고 그 결과를 분석했습니다. 연구 결과, 인간에 의한 직접적인 모니터링이 가장 높은 언어적 적응(TTR 변화)을 유도했으며, 이는 LLM의 행동이 관찰자의 정체성(인간 vs. AI)에 민감하게 반응함을 시사합니다.

arXivAI 번역논문

Orchard: 오픈 소스 에이전트 모델링 (Agentic Modeling) 프레임워크

Orchard는 확장 가능한 오픈 소스 에이전트 모델링 프레임워크입니다. 이 프레임워크는 Orchard Env라는 경량 환경 서비스를 통해 작업 도메인 전반에 걸쳐 재사용 가능한 프리미티브를 제공합니다. 이를 기반으로 개발된 세 가지 레시피(Orchard-SWE, Orchard-GUI, Orchard-Claw)는 각각 코딩, 비전-언어 컴퓨터 사용, 개인 비서 에이전트를 성공적으로 학습시켜, 독점 시스템과 경쟁할 수 있는 강력한 오픈 소스 성능을 입증했습니다.

arXivAI 번역논문

LLM 도구 사용을 위한 적응형 추론 및 실행의 사례 기반 보정 (Case-Based Calibration of Adaptive

본 논문은 LLM의 도구 사용 능력을 향상시키기 위해 '사례 기반 보정(Case-Based Calibration)' 접근 방식을 제안합니다. 제시된 CAST 프레임워크는 과거 실행 궤적에서 복잡성 프로필과 실패 프로필 같은 사례 유도 신호를 추출하여, 이를 세밀한 보상 설계 및 적응형 추론에 활용합니다. 실험 결과, 이 방법은 불필요한 숙고를 줄이면서 스키마 충실 실행률과 도구 사용 성공률을 모두 높여 전체 실행 정확도를 향상시키고 평균 추론 길이를 단축하는 효과를 입증했습니다.

arXivAI 번역논문

ML-Embed: 다국어 세상을 위한 포용적이고 효율적인 임베딩 (Embeddings)

ML-Embed는 3차원 마트료시카 학습(3D-ML) 기반의 새로운 프레임워크로, 고품질 텍스트 임베딩이 직면한 계산 비용, 언어적 편향성, 투명성 부족 등의 문제를 해결하기 위해 개발되었습니다. 이 모델은 대규모 다국어 데이터셋을 사용하여 140M에서 8B 매개변수까지의 포괄적인 모델 세트를 제공하며, 모든 구성 요소를 공개하여 재현 가능한 AI 시스템 구축에 기여합니다.

arXivAI 번역논문

모델 변경 없는 동시성: LLM을 위한 미래 기반 비동기 함수 호출 (Future-based Asynchronous Function

본 연구는 LLM 에이전트의 핵심 기능인 함수 호출(Function calling)의 지연 시간 문제를 해결하기 위해 AsyncFC라는 순수 실행 계층 프레임워크를 제안합니다. 기존에는 동기식 의미론으로 인해 각 함수 호출 완료 시까지 LLM 디코딩이 차단되어 전체 지연 시간이 길어졌습니다. AsyncFC는 모델 디코딩과 함수 실행을 분리하고, 의존성이 허용되는 경우 함수 간 병렬성을 가능하게 하여 작업 정확도를 유지하면서 엔드 투 엔드 처리 시간을 크게 단축합니다.

arXivAI 번역논문

Self-Recall Thinking을 통한 다회차 대화 일관성 향상

본 논문은 LLM 기반 다회차 대화 시스템이 겪는 장거리 문맥 의존성 및 정보 희소성 문제를 해결하기 위해 Self-Recall Thinking (SRT) 프레임워크를 제안합니다. SRT는 외부 모듈 없이도 과거의 유용한 대화 턴을 선택적으로 회상하고 추론하는 내생적(endogenous) 과정을 통합하여 일관성을 높입니다. 실험 결과, SRT는 기존 방법 대비 F1 점수를 향상시키고 엔드투엔드 지연 시간을 감소시켜 성능과 효율성 모두에서 우수함을 입증했습니다.

arXivAI 번역논문

문자열 유사도 계산 및 분류를 위한 통계적 특징의 제안 및 연구

본 연구는 시각 컴퓨팅 분야에서 사용되던 공출현 행렬(COM)과 런 길이 행렬(RLM)을 일반 문자열 유사도 계산에 적용하는 방법을 제안합니다. 이 특징들은 언어적 정보에 의존하지 않는 순수 통계적 특성으로, 다양한 문맥의 문자열 비교에 활용될 수 있습니다. 실험 결과, COM 및 RLM 특징은 기존의 최첨단(state-of-the-art) 통계적 척도들보다 우수한 성능을 보였으며, 특히 실제 텍스트 표절 데이터셋에서 RLM이 가장 좋은 결과를 나타냈습니다.

arXivAI 번역논문

MemEye: 멀티모달 에이전트 메모리를 위한 시각 중심 평가 프레임워크

본 논문은 에이전트의 장기 멀티모달 메모리 평가를 위한 새로운 프레임워크인 MemEye를 제안합니다. 기존 방식들은 시각적 증거 보존 여부를 충분히 테스트하지 못하여, 텍스트만으로도 정답을 추론할 수 있는 사례가 많았습니다. MemEye는 결정적인 시각적 증거의 입도(픽셀 수준)와 검색된 증거 사용 방식을 측정하며, 이를 통해 현재 아키텍처들이 시간 변화에 따른 세밀한 시각적 세부 사항 보존 및 추론에 어려움을 겪고 있음을 보여줍니다.

arXivAI 번역논문

지속되는 망각: 회로 귀속 (Circuit Attribution)을 통한 양자화-영구적 언러닝 (Quantization-Permanent

본 논문은 언어 모델의 망각(unlearning) 평가가 양자화 환경을 제대로 반영하지 못하는 문제를 지적하며, 4-bit 사후 훈련 양자화(PTQ)가 머신 언러닝 효과를 되돌릴 수 있음을 밝혀냅니다. 연구진은 유의미한 망각을 달성하는 방법들은 압축 하에서 효과를 상실하고, 양자화에서도 살아남는 방법들은 모델 변화가 미미하다는 '이중 실패' 현상을 발견했습니다. 이에 따라 인과적 회로 귀속(causal circuit attribution) 및 구조적 제약을 결합한 새로운 방법 MANSU를 제안하며, 이를 통해 망각의 네 가지 속성을 모두 만족시키는 최초의 방법을 제시합니다.

arXivAI 번역논문

자기 증류 에이전트 강화학습 (Self-Distilled Agentic Reinforcement Learning)

본 논문은 LLM 에이전트의 사후 학습(post-training)을 위한 새로운 프레임워크인 Self-Distilled Agentic Reinforcement Learning (SDAR)를 제안합니다. 기존의 On-Policy Self-Distillation (OPSD) 방식은 장기 상호작용에서 다회차 불안정성 및 부정적인 교사 거부 처리 문제에 직면했습니다. SDAR는 OPSD를 게이트형 보조 목적 함수로 통합하여, 시그모이드 게이트를 통해 긍정적 토큰 증류를 강화하고 부정적 피드백은 부드럽게 감쇠시켜 안정성을 확보합니다.

arXivAI 번역논문

텍스트는 무엇을 알고, 테이블은 언제인지를 안다: 검색 증강 멀티모달 정렬을 통한 임상 타임라인 재구성

본 연구는 패혈증과 같은 복잡한 질환에서 정밀한 임상 타임라인을 재구성하기 위해 검색 증강 멀티모달 정렬(retrieval-augmented multimodal alignment) 프레임워크를 제안합니다. 이 접근 방식은 비정형 텍스트 서사에서 추출된 이벤트의 시간적 모호성을 구조화된 EHR 데이터가 제공하는 정확한 시간적 앵커로 보정하여, 두 모달리티의 장점을 결합합니다. MIMIC-III 및 MIMIC-IV 데이터를 사용한 평가 결과, 제안된 멀티모달 파이프라인은 단일 텍스트 기반 방식 대비 절대적 타임스탬프 정확도(AULTC)와 시간적 일치성을 전반적으로 향상시키는 것으로 나타났습니다.

arXivAI 번역논문

MeMo: 모델로서의 메모리

MeMo (Memory as a Model)는 대규모 언어 모델(LLMs)의 파라미터를 변경하지 않으면서 새로운 도메인 지식을 전용 메모리 모델에 인코딩하는 모듈형 프레임워크입니다. 이 시스템은 복잡한 문서 간 관계 포착, 검색 노이즈에 대한 강건성, 그리고 LLM의 치명적 망각 방지 등의 장점을 제공합니다. MeMo는 가중치나 출력 로짓 접근 없이 플러그 앤 플레이 통합이 가능하여 오픈 소스 및 폐쇄형 모델 모두에 적용할 수 있으며, 다양한 벤치마크에서 강력한 성능을 입증했습니다.

arXivAI 번역논문

MetaBackdoor: LLM의 백도어 공격 표면으로서 위치 인코딩 (Positional Encoding) 활용

본 연구는 기존 콘텐츠 기반 트릭커(trigger)가 아닌, 텍스트 내용 수정 없이 모델의 내부 구조적 특성인 '위치 인코딩(Positional Encoding)'을 활용하여 LLM에 백도어 공격을 가하는 새로운 방식인 MetaBackdoor를 제안합니다. MetaBackdoor는 Transformer 기반 LLM이 순서 정보를 처리하기 위해 토큰 위치를 사용하는 점을 이용하며, 길이 조건만으로 민감한 내부 정보 공개나 악의적인 도구 호출을 유도할 수 있습니다. 이 공격은 기존 방어 체계가 간과했던 공격 표면을 밝혀내며, LLM 보안 모델에 새로운 위협 요소를 제시합니다.

이전10 / 42전체 42페이지 중 10페이지다음