Insights
AI가 자동으로 큐레이션·번역·정리하는 기술 동향 피드입니다.
© 2026 Molayo
AI가 자동으로 큐레이션·번역·정리하는 기술 동향 피드입니다.
본 페이지의 콘텐츠는 AI가 공개된 소스를 기반으로 자동 수집·요약·번역한 것입니다. 원 저작권은 각 원저작자에게 있으며, 각 게시물의 “원문 바로가기” 링크를 통해 원문을 확인할 수 있습니다. 저작권자의 삭제 요청이 있을 경우 신속히 조치합니다.
에이전트 메모리 평가 시 발생하는 혼란 변수를 통제하기 위한 새로운 프로토콜인 MemDelta를 제안합니다. 실험을 통해 임베딩 모델이나 LLM의 변화가 메모리 성능 평가 결과에 결정적인 영향을 미칠 수 있음을 입증했습니다.
언어 모델의 정렬(Alignment) 과정을 열역학적 상전이 이론인 '결정화' 관점에서 분석한 연구입니다. 사후 학습 중 모델의 행동 변화를 고엔트로피 액체, 핵 생성, 안정화의 세 단계로 정의하여 정렬 역학에 대한 물리적 직관을 제공합니다.
RLVR 학습 시 정답을 찾지 못하는 '제로 히트' 프롬프트 문제를 해결하기 위한 LatentRevise 방법을 제안합니다. 실패한 롤아웃과 정답을 활용해 입력 임베딩을 최적화함으로써 학습 신호를 복구합니다. 이를 통해 수학 벤치마크에서 SFT 및 RLVR 성능을 향상시켰습니다.
RAG 시스템에서 쿼리마다 검색할 구절의 수를 동적으로 결정하는 '보정된 검색 예산 할당' 연구를 소개합니다. 확률 인터페이스를 통해 불확실성을 정답 확률로 보정하여, 효율적인 컨텍스트 선택과 지연 시간 및 토큰 비용 최적화를 달성합니다.
LLM이 다중 턴 대화에서 지시 계층(Instruction Hierarchies)을 유지하지 못하는 문제를 해결하기 위한 IHDec를 제안합니다. JSD 프레임워크를 활용해 별도의 미세 조정 없이도 토큰 수준에서 계층 위반을 감지하고 대조 디코딩을 통해 이를 교정합니다.
LLM의 수학적 추론 시 표면적 변이와 실제 전략적 차이(접근 방식 수준의 다양성) 사이의 간극을 분석한 연구입니다. 기존 다양성 지표가 실제 추론 전략을 반영하지 못함을 밝히고, 이를 개선하기 위한 과제를 제시합니다.
LLM 에이전트의 컨텍스트 관리 한계를 해결하기 위해, 모델의 내부 상태를 시각화하고 관리하는 VISTA 프레임워크를 제안합니다. VISTA는 학습 없이도 작업 기억을 블록 단위로 관리하여 Gemini 등 다양한 모델의 성능을 크게 향상시킵니다.
텍스트 속성 그래프(TAG)에서 노드와 이웃 간의 의미론적 불일치를 탐지하는 N2NSC 프레임워크를 제안합니다. LLM과 그래프 위상 정보를 결합하여 텍스트 의미론과 구조적 관계 사이의 대응 관계를 효과적으로 포착합니다.
텍스트 형태의 기술 지침을 LoRA 어댑터로 변환하여 모델의 매개변수에 직접 인코딩하는 ParametricSkills 프레임워크를 제안합니다. 이를 통해 긴 문맥에서도 기술을 효율적으로 활용하며, 인컨텍스트 학습보다 높은 성능과 지속 학습의 가능성을 보여줍니다.
LLM이 대중의 문화적 취향을 모사할 때 발생하는 편향과 한계를 분석한 연구입니다. OpenAI, Anthropic, DeepSeek 모델을 활용해 생성된 '실리콘 대리인'이 인간의 실제 취향 구조를 정형화된 방식으로 왜곡함을 증명했습니다.
본 연구는 RAG 시스템 내 생성 단계에서 소형 언어 모델(SLM)의 성능과 효용성을 조사합니다. 다양한 데이터셋을 통한 벤치마킹 결과, SLM 기반 RAG 시스템이 GPU 없이 온디바이스 환경에서도 효율적으로 실행될 수 있음을 입증했습니다.
TIGRAG는 토큰 공생 지식 그래프를 활용하여 멀티홉 추론 성능을 개선한 효율적인 RAG 프레임워크입니다. 기존 그래프 RAG의 높은 계산 비용과 LLM 의존성을 해결하며, 인덱싱 및 추론 지연 시간을 대폭 단축했습니다.
대화 중 의미론적 콘텐츠의 흐름을 정량화하는 정보 이론적 프레임워크를 제안합니다. LLM을 활용해 의미론적 전이 엔트로피(STE)와 부분 정보 분해(SPID)를 계산하여 정보의 방향성과 기여도를 분석합니다.
Chain-of-Thought(CoT) 프롬프팅의 효과가 단순히 토큰 길이에 의한 연산량 증가 때문인지, 아니면 의미론적 내용 때문인지 분석한 연구입니다. 실험 결과, CoT의 성능 향상은 단순한 장황함이 아니라 추론 및 검증 과정에 담긴 질적인 내용에 달려 있음을 입증했습니다.
본 연구는 DNA 언어 모델의 사전 학습(Pre-training)이 미세 조정(Fine-tuning) 성능에 미치는 영향을 체계적으로 평가합니다. 트랜스포머 기반 모델의 효율성과 BPE 토큰화 방식의 적절성을 중심으로 벤치마크 분석을 수행합니다.
텍스트-비디오 생성 모델의 품질을 높이기 위해 데이터 매니폴드를 보상 모델로 활용하는 Shell-LCC 기법을 제안합니다. LCC의 평균 회귀 문제를 해결하기 위해 등방성 쉘 모델링을 도입하여 비디오의 사실성과 세부 디테일을 개선합니다.
문맥적 언어 모델이 문법적 성별과 사회적 편향을 혼동하는 문제를 해결하기 위해, 문맥적 임베딩에서 문법적 성별을 분리하는 연구를 수행했습니다. 통제된 템플릿과 자연스러운 문맥을 활용하여 성별 방향을 추정하는 프레임워크를 제안했습니다.
Cortex는 웹 규모의 코퍼스를 체계적으로 조직화하기 위해 온톨로지 코퍼스 그래프(OCG)를 활용하는 새로운 프레임워크를 제안합니다. 3층 구조의 이종 구조를 통해 고품질 데이터 정제와 도메인 간 연관성을 확보하며, 이를 검증하기 위한 CortexBench를 함께 선보입니다.
DAIN은 멀티모달 융합을 동적인 다중 에이전트 협력 프로세스로 재개념화한 새로운 프레임워크입니다. 메타 컨트롤러를 통해 에이전트의 희소 활성화와 통신을 조율하여 정확도와 효율성을 동시에 최적화합니다.
방사선 보고서 생성(RRG) 모델이 시각적 증거 대신 사전 지식이나 가짜 상관관계에 의존하는 '시각적 지름길' 문제를 평가하기 위한 새로운 벤치마크 SHOVIR을 제안합니다. 8개의 최첨단 VLM을 분석한 결과, 보고서 품질이 높더라도 시각적 근거 제시 능력은 낮을 수 있음을 확인했습니다.