본문으로 건너뛰기

Home About Portfolio Blog Insights Resume Contact

Home About Portfolio Blog Insights Resume Contact

© 2026 Molayo

Insights

AI가 자동으로 큐레이션·번역·정리하는 기술 동향 피드입니다.

© 2026. Molayo. All rights reserved.

개인정보 처리방침|이용약관

Home About Portfolio Blog Insights Resume Contact

Home About Portfolio Blog Insights Resume Contact

© 2026 Molayo

Insights

AI가 자동으로 큐레이션·번역·정리하는 기술 동향 피드입니다.

이 피드 구독하기

RSSFeedly, Inoreader 등으로 구독

API/api/search?q=검색어

AIllms.txt로 AI 크롤링 가이드

본 페이지의 콘텐츠는 AI가 공개된 소스를 기반으로 자동 수집·요약·번역한 것입니다. 원 저작권은 각 원저작자에게 있으며, 각 게시물의 “원문 바로가기” 링크를 통해 원문을 확인할 수 있습니다. 저작권자의 삭제 요청이 있을 경우 신속히 조치합니다.

© 2026. Molayo. All rights reserved.

개인정보 처리방침|이용약관

MemDelta: 에이전트 메모리 평가에서의 통제된 베이스라인 및 숨겨진 혼란 변수

에이전트 메모리 평가 시 발생하는 혼란 변수를 통제하기 위한 새로운 프로토콜인 MemDelta를 제안합니다. 실험을 통해 임베딩 모델이나 LLM의 변화가 메모리 성능 평가 결과에 결정적인 영향을 미칠 수 있음을 입증했습니다.

정렬 역학(Alignment Dynamics)에 대한 물리적 직관을 향하여: 무작위 결정화(Randomness Crystallization)

언어 모델의 정렬(Alignment) 과정을 열역학적 상전이 이론인 '결정화' 관점에서 분석한 연구입니다. 사후 학습 중 모델의 행동 변화를 고엔트로피 액체, 핵 생성, 안정화의 세 단계로 정의하여 정렬 역학에 대한 물리적 직관을 제공합니다.

LatentRevise: Zero-Hit 추론으로부터의 학습

RLVR 학습 시 정답을 찾지 못하는 '제로 히트' 프롬프트 문제를 해결하기 위한 LatentRevise 방법을 제안합니다. 실패한 롤아웃과 정답을 활용해 입력 임베딩을 최적화함으로써 학습 신호를 복구합니다. 이를 통해 수학 벤치마크에서 SFT 및 RLVR 성능을 향상시켰습니다.

가져오기 전에 알기: 검색 증강 생성(RAG)을 위한 보정된 검색 예산 할당

RAG 시스템에서 쿼리마다 검색할 구절의 수를 동적으로 결정하는 '보정된 검색 예산 할당' 연구를 소개합니다. 확률 인터페이스를 통해 불확실성을 정답 확률로 보정하여, 효율적인 컨텍스트 선택과 지연 시간 및 토큰 비용 최적화를 달성합니다.

IHDec: 다중 턴 지시 계층 (Instruction Hierarchies) 보안을 위한 발산 유도 대조 디코딩

LLM이 다중 턴 대화에서 지시 계층(Instruction Hierarchies)을 유지하지 못하는 문제를 해결하기 위한 IHDec를 제안합니다. JSD 프레임워크를 활용해 별도의 미세 조정 없이도 토큰 수준에서 계층 위반을 감지하고 대조 디코딩을 통해 이를 교정합니다.

우리는 전략을 측정하고 있는가, 아니면 표현 방식을 측정하고 있는가? LLM 수학적 추론에서 표면적 다양성과 접근 방식 수준 다양성 사이의 간극

LLM의 수학적 추론 시 표면적 변이와 실제 전략적 차이(접근 방식 수준의 다양성) 사이의 간극을 분석한 연구입니다. 기존 다양성 지표가 실제 추론 전략을 반영하지 못함을 밝히고, 이를 개선하기 위한 과제를 제시합니다.

LLM 에이전트는 잠재적 컨텍스트 관리자이다: 자기 관리형 컨텍스트를 이끌어내는 고유 수용적 대시보드

LLM 에이전트의 컨텍스트 관리 한계를 해결하기 위해, 모델의 내부 상태를 시각화하고 관리하는 VISTA 프레임워크를 제안합니다. VISTA는 학습 없이도 작업 기억을 블록 단위로 관리하여 Gemini 등 다양한 모델의 성능을 크게 향상시킵니다.

노드-이웃 간 의미론적 일관성: TAG 이상 탐지를 위한 텍스트-위상 정렬

텍스트 속성 그래프(TAG)에서 노드와 이웃 간의 의미론적 불일치를 탐지하는 N2NSC 프레임워크를 제안합니다. LLM과 그래프 위상 정보를 결합하여 텍스트 의미론과 구조적 관계 사이의 대응 관계를 효과적으로 포착합니다.

매개변수적 기술 (Parametric Skills)

텍스트 형태의 기술 지침을 LoRA 어댑터로 변환하여 모델의 매개변수에 직접 인코딩하는 ParametricSkills 프레임워크를 제안합니다. 이를 통해 긴 문맥에서도 기술을 효율적으로 활용하며, 인컨텍스트 학습보다 높은 성능과 지속 학습의 가능성을 보여줍니다.

완전한 인간은 아닌 취향: LLM 설문 대리인의 정형화된 잡식성

LLM이 대중의 문화적 취향을 모사할 때 발생하는 편향과 한계를 분석한 연구입니다. OpenAI, Anthropic, DeepSeek 모델을 활용해 생성된 '실리콘 대리인'이 인간의 실제 취향 구조를 정형화된 방식으로 왜곡함을 증명했습니다.

작은 두뇌, 큰 업적: 소형 언어 모델(Compact Language Models) 탐구

본 연구는 RAG 시스템 내 생성 단계에서 소형 언어 모델(SLM)의 성능과 효용성을 조사합니다. 다양한 데이터셋을 통한 벤치마킹 결과, SLM 기반 RAG 시스템이 GPU 없이 온디바이스 환경에서도 효율적으로 실행될 수 있음을 입증했습니다.

토큰 공생 그래프를 통한 효율적인 검색 증강 생성 (Efficient Retrieval-Augmented Generation via Token

TIGRAG는 토큰 공생 지식 그래프를 활용하여 멀티홉 추론 성능을 개선한 효율적인 RAG 프레임워크입니다. 기존 그래프 RAG의 높은 계산 비용과 LLM 의존성을 해결하며, 인덱싱 및 추론 지연 시간을 대폭 단축했습니다.

언어 의사소통의 정보 역학 (Information Dynamics of Language Communication)

대화 중 의미론적 콘텐츠의 흐름을 정량화하는 정보 이론적 프레임워크를 제안합니다. LLM을 활용해 의미론적 전이 엔트로피(STE)와 부분 정보 분해(SPID)를 계산하여 정보의 방향성과 기여도를 분석합니다.

상세한 Chain-of-Thought (CoT)가 정말 도움이 될까? 내용이 중요한 것이지 길이가 중요한 것이 아니라는 분포

Chain-of-Thought(CoT) 프롬프팅의 효과가 단순히 토큰 길이에 의한 연산량 증가 때문인지, 아니면 의미론적 내용 때문인지 분석한 연구입니다. 실험 결과, CoT의 성능 향상은 단순한 장황함이 아니라 추론 및 검증 과정에 담긴 질적인 내용에 달려 있음을 입증했습니다.

DNA 언어 모델: 미세 조정 (Fine-Tuning) 작업을 위한 사전 학습 (Pre-Training) 평가

본 연구는 DNA 언어 모델의 사전 학습(Pre-training)이 미세 조정(Fine-tuning) 성능에 미치는 영향을 체계적으로 평가합니다. 트랜스포머 기반 모델의 효율성과 BPE 토큰화 방식의 적절성을 중심으로 벤치마크 분석을 수행합니다.

당신의 데이터 매니폴드는 비밀리에 보상 모델이다: 텍스트-비디오 생성(Text-to-Video Generation)을 위한 Shell-LCC

텍스트-비디오 생성 모델의 품질을 높이기 위해 데이터 매니폴드를 보상 모델로 활용하는 Shell-LCC 기법을 제안합니다. LCC의 평균 회귀 문제를 해결하기 위해 등방성 쉘 모델링을 도입하여 비디오의 사실성과 세부 디테일을 개선합니다.

통제된 문맥 및 자연스러운 문맥 하에서의 문맥적 임베딩 내 문법적 성별 방향 추정

문맥적 언어 모델이 문법적 성별과 사회적 편향을 혼동하는 문제를 해결하기 위해, 문맥적 임베딩에서 문법적 성별을 분리하는 연구를 수행했습니다. 통제된 템플릿과 자연스러운 문맥을 활용하여 성별 방향을 추정하는 프레임워크를 제안했습니다.

CORTEX: 온톨로지 코퍼스 그래프(Ontological Corpus Graph)를 통한 웹 규모 코퍼스의 고품질 교차 도메인 조직화

Cortex는 웹 규모의 코퍼스를 체계적으로 조직화하기 위해 온톨로지 코퍼스 그래프(OCG)를 활용하는 새로운 프레임워크를 제안합니다. 3층 구조의 이종 구조를 통해 고품질 데이터 정제와 도메인 간 연관성을 확보하며, 이를 검증하기 위한 CortexBench를 함께 선보입니다.

DAIN: 효율적이고 협력적인 멀티모달 추론을 위한 동적 에이전트 기반 상호작용 네트워크

DAIN은 멀티모달 융합을 동적인 다중 에이전트 협력 프로세스로 재개념화한 새로운 프레임워크입니다. 메타 컨트롤러를 통해 에이전트의 희소 활성화와 통신을 조율하여 정확도와 효율성을 동시에 최적화합니다.

SHOVIR: 방사선 보고서 생성(RRG)에서의 시각적 지름길 학습(Vision Shortcut Learning) 평가를 위한 벤치마크

방사선 보고서 생성(RRG) 모델이 시각적 증거 대신 사전 지식이나 가짜 상관관계에 의존하는 '시각적 지름길' 문제를 평가하기 위한 새로운 벤치마크 SHOVIR을 제안합니다. 8개의 최첨단 VLM을 분석한 결과, 보고서 품질이 높더라도 시각적 근거 제시 능력은 낮을 수 있음을 확인했습니다.

이전267 / 2797다음