본문으로 건너뛰기

Home About Portfolio Blog Insights Resume Contact

Home About Portfolio Blog Insights Resume Contact

© 2026 Molayo

Insights

AI가 자동으로 큐레이션·번역·정리하는 기술 동향 피드입니다.

© 2026. Molayo. All rights reserved.

개인정보 처리방침|이용약관

Home About Portfolio Blog Insights Resume Contact

Home About Portfolio Blog Insights Resume Contact

© 2026 Molayo

Insights

AI가 자동으로 큐레이션·번역·정리하는 기술 동향 피드입니다.

이 피드 구독하기

RSSFeedly, Inoreader 등으로 구독

API/api/search?q=검색어

AIllms.txt로 AI 크롤링 가이드

본 페이지의 콘텐츠는 AI가 공개된 소스를 기반으로 자동 수집·요약·번역한 것입니다. 원 저작권은 각 원저작자에게 있으며, 각 게시물의 “원문 바로가기” 링크를 통해 원문을 확인할 수 있습니다. 저작권자의 삭제 요청이 있을 경우 신속히 조치합니다.

© 2026. Molayo. All rights reserved.

개인정보 처리방침|이용약관

arXiv cs.CL (NLP) 1795건필터 해제

자기 적응형 LLM 에이전트의 평가자 주도 선호도 역학에 대한 진단 프레임워크 및 다중 평가자 감사

LLM 평가자의 측정값이 시간이 지남에 따라 무효화되는 현상을 탐지하기 위한 진단 프레임워크(EPC)를 제안합니다. GPT-4o의 버전 업데이트에 따른 성능 드리프트와 자기 평가의 선호도 붕괴 문제를 정량적으로 분석했습니다.

온프레미스 Open LLM은 Text-to-SQL에서 어디까지 도달했는가? BIRD 데이터셋을 통한 모델군별 크기 x 기술 프런티어 분석

BIRD 데이터셋을 활용하여 온프레미스 환경에서 실행되는 오픈 웨이트 모델들의 Text-to-SQL 성능을 분석한 연구입니다. Qwen2.5-Coder, CodeLlama, Llama-3.x 모델군을 대상으로 스키마 연결, 자기 수정 등 다양한 기술적 레시피의 효과를 검증했습니다.

빠른 숫자, 느린 언어: 정량적 및 정성적 실적 신호의 가교 역할

실적 발표 시 발생하는 정량적 수치와 정성적 언어 신호의 시차 및 특성을 분석합니다. 연구진은 EarningsInOne 코퍼스를 통해 두 신호가 시장에 미치는 영향력과 거래 가능 시점이 다름을 입증했습니다.

Mandol: 장기 대화를 위한 응집형 에이전트 메모리 시스템

Mandol은 파편화된 에이전트 메모리를 통합된 메모리 네이티브 아키텍처로 구축하는 응집형 메모리 시스템입니다. 계층적 시맨틱 그래프와 하이브리드 검색 연산자를 통해 기존 RAG 방식의 지연 시간과 노이즈 문제를 해결합니다.

자동 질병 분류 매핑에서의 맵 카디널리티(Map Cardinality) 관리: 정밀도(Precision), 재현율(Recall) 및

질병 분류 체계(ICD) 간의 자동 매핑 시 발생하는 일대다(one-to-many) 시나리오의 정밀도와 재현율 문제를 해결하기 위한 새로운 방법론을 제안합니다. LLM 기반의 블로킹 및 매칭 파이프라인을 통해 높은 정밀도와 넓은 커버리지를 동시에 달성했습니다.

인간은 진화된 지시 이행자(Instruction Followers)인가? 빠른 지시 학습을 가능하게 하는 근본적인 귀납적 편향

인간의 빠른 지시 학습(RITL) 능력이 진화 과정에서 형성된 '지시 이행 편향' 덕분이라는 가설을 제시합니다. 이 편향은 LLM의 지시 튜닝과 유사한 역할을 하며, 인지 과학과 머신러닝을 결합한 학제 간 연구의 필요성을 강조합니다.

Fund2Persona: 펀드 공시 데이터를 활용한 금융 자문가 페르소나 구축 및 정교화 프레임워크

펀드 공시 데이터와 시장 맥락을 활용하여 금융 자문가 페르소나를 구축하고 정교화하는 Fund2Persona 프레임워크를 제안합니다. actor-scorer-patcher 루프를 통해 전문적인 투자 관점을 LLM에 이식하며, 시장 시나리오 생성 및 맞춤형 자문 대화에서 우수한 성능을 입증했습니다.

GPU 없이 어디까지 가능할까? 질의응답, 대화 및 요약 전반에 걸친 경량 환각 탐지(Hallucination Detection)의 체계적

GPU 없이 CPU 환경에서 실행 가능한 경량 환각 탐지(Hallucination Detection) 방법론들을 체계적으로 벤치마크한 연구입니다. ROUGE-L, BERTScore, NLI 탐지기 등 5가지 방식을 QA, 대화, 요약 작업에 적용하여 성능을 비교했습니다.

SrDetection: 코드 거대 언어 모델 (Code LLMs)의 데이터 누출 탐지를 위한 자기 참조 (Self-Referential)

Code LLM의 벤치마크 성능이 인위적으로 부풀려지는 데이터 누출 문제를 해결하기 위한 새로운 프레임워크 SrDetection을 제안합니다. 모델의 로짓이나 출력에 접근하는 방식에 따라 그레이박스 및 블랙박스 설정 모두에서 작동하며, 의미론적 변형을 통해 누출을 효과적으로 탐지합니다.

신경 절차적 메모리 (Neural Procedural Memory): 암시적 활성화 스티어링 (Implicit Activation

LLM 에이전트의 지속적인 작업 수행을 위해 명시적 텍스트 지침 대신 활성화 공간 내 스티어링 벡터를 사용하는 '신경 절차적 메모리(NPM)' 프레임워크를 제안합니다. NPM은 과거 경험을 통해 절차적 기술을 증류하여 모델의 내부 표현을 직접 활성화함으로써 텍스트와 행동 사이의 단절을 해결합니다.

자연어 처리(NLP) 기술 발전의 규명: 과학적 엔티티 중심 관점

본 연구는 주제 중심의 기존 분석 방식에서 벗어나 엔티티 중심 관점에서 NLP 기술 발전을 분석합니다. NLP 논문에서 방법론, 데이터셋, 평가지표 등 핵심 엔티티를 추출하여 기술 트렌드의 변화를 정량적으로 규명했습니다.

MATCH: 긴 문맥 Transformer를 위한 인컨텍스트 검색 기반 어텐션 조절

긴 문맥 처리를 위한 Transformer의 계산 비용 문제를 해결하기 위해 인컨텍스트 검색 기반의 어텐션 조절 프레임워크인 MATCH를 제안합니다. MATCH는 희소 어텐션 메커니즘에 동적으로 통합된 정보를 증강하여 성능 저하 없이 효율성을 높입니다.

매끄러운 스케일링 법칙(Scaling Laws)에 숨겨진 단계별 토큰 학습

언어 모델의 스케일링 법칙이 발생하는 원인을 토큰 수준의 학습 이벤트로 분석한 연구입니다. 토큰 학습이 특정 시점에 집중되는 '학습 시간 스펙트럼'이 스케일링 법칙의 형태를 결정함을 입증했습니다.

자연어 처리(NLP) 분야에서 알고리즘 언급 동기에 대한 탐색: 딥러닝 접근 방식

NLP 논문에서 알고리즘이 언급되는 동기(설명, 사용, 비교, 개선)를 식별하고 분석하는 문장 수준의 프레임워크를 제안합니다. 딥러닝 모델을 통해 알고리즘 언급 패턴의 시간적 진화와 유형별 특징을 규명했습니다.

KbSD: 에이전트 검색의 행동 교정을 위한 지식 경계 인식 자기 증류 (Knowledge Boundary aware

에이전트 검색 시 발생하는 보상 희소성 문제를 해결하기 위해 지식 경계 인식 자기 증류(KbSD) 프레임워크를 제안합니다. 토큰 수준의 밀집 감독과 사분면 적응형 최적화를 통해 모델이 파라미터 메모리와 검색 결과 사이에서 최적의 결정을 내리도록 돕습니다.

중국 문헌정보학(LIS) 분야의 신규성 진화 양상 규명

중국 문헌정보학(LIS) 분야의 학술 논문 신규성 진화 양상을 분석한 연구입니다. BERTopic과 조합적 혁신 이론을 활용하여 주제별 신규성 차이와 저자 협업 패턴 간의 상관관계를 규명했습니다.

ARKD: 텍스트 생성을 위한 적응형 강화학습 유도 양방향 KL 발산 증류 (Adaptive Reinforcement

지식 증류 과정에서 발생하는 주요 분포와 롱테일 확률 모델링 간의 불균형을 해결하기 위한 새로운 프레임워크를 제안합니다. 강화학습을 통해 FKL과 RKL의 가중치를 동적으로 조절하여 생성 품질과 일반화 성능을 동시에 향상시킵니다.

임상 추론 그래프: LLM 진단 추론의 구조적 평가를 통해 드러난 일관성 없는 역량

LLM의 임상 진단 정확도와 실제 추론 과정의 구조적 일관성 사이의 괴리를 분석한 연구입니다. 임상 추론 그래프를 통해 모델이 유사한 사례에 대해 일관된 추론 패턴을 보이는지 평가한 결과, 정확도와 별개로 구조적 일관성이 부족함을 확인했습니다.

SABER-Math: 수학 분야 정보 검색 (IR) 평가를 위한 자동화된 벤치마크

수학적 정보 검색(IR) 성능을 평가하기 위한 최초의 완전 자동화된 벤치마크인 SABER-Math를 소개합니다. LLM을 활용해 수학적 관련성을 정밀하게 측정하며, 기존 범용 벤치마크가 수학적 특수성을 반영하지 못하는 한계를 극복하고자 합니다.

Mamba의 타임스텝(Timesteps)은 인간의 읽기 시간과 일치한다

Mamba 모델의 단어당 처리 시간인 이산화 타임스텝($Δ_t$)이 인간의 실제 읽기 시간과 밀접하게 일치함을 입증한 연구입니다. Mamba의 내부 역학을 통해 인간의 실시간 언어 처리 과정을 분석할 수 있는 새로운 관점을 제시합니다.

이전9 / 90다음