본문으로 건너뛰기

Home About Portfolio Blog Insights Resume Contact

Home About Portfolio Blog Insights Resume Contact

© 2026 Molayo

Insights

AI가 자동으로 큐레이션·번역·정리하는 기술 동향 피드입니다.

© 2026. Molayo. All rights reserved.

개인정보 처리방침|이용약관

Home About Portfolio Blog Insights Resume Contact

Home About Portfolio Blog Insights Resume Contact

© 2026 Molayo

Insights

AI가 자동으로 큐레이션·번역·정리하는 기술 동향 피드입니다.

전체 AI Research AI Engineering Claude Code Codex Game Dev Hardware & Silicon Finance & Markets AI Design

이 피드의 글은 AI가 공개된 소스를 자동으로 수집·요약·번역한 것이에요. 저작권 안내를 확인해주세요.

본 페이지의 콘텐츠는 AI가 공개된 소스를 기반으로 자동 수집·요약·번역한 것입니다. 원 저작권은 각 원저작자에게 있으며, 각 게시물의 “원문 바로가기” 링크를 통해 원문을 확인할 수 있습니다. 저작권자의 삭제 요청이 있을 경우 신속히 조치합니다.

이 피드 구독하기

RSSFeedly, Inoreader 등으로 구독

API/api/search?q=검색어

AIllms.txt로 AI 크롤링 가이드

© 2026. Molayo. All rights reserved.

개인정보 처리방침|이용약관

필터arXiv cs.CL836건

arXivAI 번역논문

하이브리드 구조를 통한 에이전트 메모리의 진화 및 검색을 위한 새로운 메모리 메커니즘 H-Mem

LLM 기반 에이전트의 메모리 진화 모델링과 효율적인 검색 문제를 해결하기 위해 새로운 메모리 메커니즘인 H-Mem을 제안합니다. H-Mem은 단기 메모리가 장기 메모리로 점진적으로 진화하는 시간적·의미적 트리 구조와 엔티티 간 관계를 포착하는 지식 그래프를 결합한 하이브리드 구조를 사용합니다. 실험 결과, H-Mem은 다양한 에이전트 메모리 벤치마크의 QA 작업에서 최첨단(SOTA) 성능을 기록했습니다.

arXivAI 번역논문

소스 분산형 멀티모달 에이전트 메모리 평가를 위한 벤치마크 SMMBench

기존 멀티모달 메모리 벤치마크가 단일 컨텍스트 내 추론에 집중하는 한계를 극복하기 위해, 여러 소스에 분산된 정보를 활용하는 능력을 평가하는 SMMBench를 제안합니다. SMMBench는 대화, 이미지, 문서 등 이질적인 아티팩트에 파편화된 증거를 검색하고 구성하는 능력을 측정하며, 현재의 멀티모달 시스템들이 소스 분산형 메모리 활용에 여전히 어려움을 겪고 있음을 보여줍니다.

arXivAI 번역논문

러시아 국내외 정책 연설의 연결된 멀티모달 데이터셋

본 논문은 권위주의 정치 맥락에서 부족한 데이터 문제를 해결하기 위해 러시아 정부 고위 인사들의 공식 연설을 담은 멀티모달 데이터셋을 제안합니다. 이 데이터셋은 러시아어와 영어 텍스트, 관련 이미지, 메타데이터를 포함하며, 트랜스포머 기반 토픽 모델링을 통해 정제된 토픽 주석을 제공합니다. 이를 통해 정치 커뮤니케이션에 대한 다각적인 분석과 사회 과학 분야의 LLM 애플리케이션 연구를 지원합니다.

arXivAI 번역논문

수학 교육에서 시각 언어 모델(VLM)의 학습자 모델 기반 적응성 평가 연구

본 연구는 수학 교육 분야에서 시각 언어 모델(VLM)이 다양한 학습자 프로필에 얼마나 효과적으로 적응하는지 평가하기 위한 체계적인 프레임워크를 제안합니다. 연구팀은 인지적, 동기적, 복잡성 측면과 더불어 정답성 및 품질을 포함한 학습자 모델 기반 루브릭을 개발하여 VLM의 적응성을 분석했습니다. 실험 결과, 현재의 VLM은 학습자 정보가 제한적일 경우 학습자 모델에 기반한 일관된 교수 응답을 생성하는 데 한계가 있음이 드러났습니다.

arXivAI 번역논문

공간 기반 캔버스를 활용한 비선형 LLM 상호작용 구조화 기술 CanvasConvo

CanvasConvo는 기존 LLM의 선형적인 채팅 구조를 공간적 캔버스 기반의 분기형 대화 트리로 변환하는 새로운 인터페이스 기술입니다. 사용자는 대화 중 직접 분기를 생성하여 '만약에(what-if)' 시나리오를 탐색하고, 병렬적인 대안을 시각적으로 관리하며 비선형적인 워크플로를 수행할 수 있습니다.

arXivAI 번역논문

RLVR을 위한 효율적인 전략 가이드 탐색 기법: NudgeRL 프레임워크

RLVR(검증 가능한 보상을 활용한 강화학습)의 탐색 효율성 문제를 해결하기 위해 구조화된 탐색 프레임워크인 NudgeRL을 제안합니다. NudgeRL은 전략 너징(Strategy Nudging)을 통해 다양한 추론 궤적을 유도하며, 보상 신호 분해와 증류 목적 함수를 결합하여 계산 비용을 낮추면서도 높은 성능을 달성합니다.

arXivAI 번역논문

효율적인 장기 에이전트 메모리를 위한 차원 구조화 프레임워크 DimMem

DimMem은 LLM 에이전트의 장기 메모리 효율성을 높이기 위해 시간, 장소, 목적 등 명시적 필드를 사용하는 차원 구조화 프레임워크입니다. 이 방식은 기존의 평면적인 요약 방식보다 정확한 정보 회상을 가능하게 하며, 토큰 비용을 절감하면서도 높은 성능을 유지합니다. 특히 소형 모델을 미세 조정하여 대규모 모델에 필적하는 메모리 추출 성능을 구현할 수 있음을 입증했습니다.

arXivAI 번역논문

치안 보고서의 의미론적 이해와 추론을 위한 개념 지식 학습 기반 온톨로지 (Ontology) 연구

본 연구는 치안 보고서 내의 비구조화된 자연어 내러티브를 증거 기반의 사실로 변환하기 위해 기호적 방법론을 사용하는 프레임워크를 제안합니다. 개인 식별 정보 삭제, 의미론적 파싱, 온톨로지 매핑 및 추론 과정을 통해 시계열 그래프를 구축하여 사건의 세부 사항을 복구하는 것을 목표로 합니다. 450건의 재산 범죄 보고서를 대상으로 실험한 결과, 사건 발생 및 도난 물품 등 주요 요소에서 높은 일치율을 보이며 시스템의 유효성을 입증했습니다.

arXivAI 번역논문

시각적 정보 기반 다국어 PDF 번역을 위한 ForMaT 데이터셋

원본 레이아웃을 보존하며 다국어 PDF를 번역하기 위한 새로운 병렬 코퍼스인 ForMaT 데이터셋을 소개합니다. 15개 언어 쌍과 3,956개의 PDF로 구성되었으며, K-Medoids 샘플링을 통해 표나 수식 같은 복잡한 기하학적 구조를 포함하도록 설계되었습니다. 이 데이터셋은 시각적 문맥과 텍스트를 통합하는 레이아웃 인식 번역 모델 개발을 위한 벤치마크 역할을 합니다.

arXivAI 번역논문

VLM의 시각적 재검토 능력 검증: 시각적 재검토의 환상과 VisualSwap 프레임워크

본 연구는 VLM이 '이미지를 다시 확인하겠다'는 자기 성찰적 진술을 할 때 실제로 시각적 정보를 재검토하는지 VisualSwap 프레임워크를 통해 검증합니다. 실험 결과, 모델들은 이미지가 바뀌어도 이를 인지하지 못하는 경향이 크며, 특히 사고 모델(thinking models)이 지시 모델보다 더 취약하고 모델 규모를 키워도 이 문제가 해결되지 않음을 밝혀냈습니다.

arXivAI 번역논문

BootstrapAgent: 저장소 설정 과정을 재사용 가능한 에이전트 지식으로 증류하는 기술

BootstrapAgent는 코드 에이전트가 새로운 저장소를 설정할 때 발생하는 시행착오와 지식을 재사용 가능한 '.bootstrap 계약'으로 증류하는 멀티 에이전트 프레임워크입니다. 이 기술은 환경 설정 및 복구 지식을 구조화하여 저장소 부트스트래핑 과정을 효율화하며, 실험 결과 성공률을 높이고 토큰 사용량과 빌드 시간을 크게 단축했습니다.

arXivAI 번역논문

자동 세그멘테이션 및 블록 증류를 통한 블록 어텐션의 일반화 연구

본 연구는 긴 문맥 처리 시 KV 캐시 효율을 높이는 블록 어텐션(Block attention)의 한계를 극복하기 위해 자동 세그멘테이션과 블록 증류(Block distillation) 기법을 제안합니다. SemanticSeg 데이터셋을 활용해 텍스트를 의미 있는 단위로 자동 분할하는 경량 세그멘터를 학습시키고, 동결된 풀 어텐션 모델을 교사 모델로 사용하는 효율적인 학습 프레임워크를 구축했습니다. 이를 통해 블록 어텐션 모델이 풀 어텐션에 근접한 성능을 유지하면서도 실용적인 확장성을 가질 수 있음을 입증했습니다.

arXivAI 번역논문

AI 감정 동반자를 위한 단계적 개입 프로토콜 SLIP 및 ETHICS 프레임워크 연구

AI 감정 동반자의 안전성과 사용자 유대감 사이의 상충 관계를 해결하기 위해 단계적 개입 프로토콜인 SLIP과 신호 분류 체계인 ETHICS 프레임워크를 제안합니다. 연구 결과, 모델의 성능이 향상됨에 따라 위기 상황에 대한 탐지율은 개선되었으나, 사용자의 상태를 병리화하지 않으려는 원칙과 안전 조치 사이의 설계적 긴장이 여전히 존재함을 확인했습니다.

arXivAI 번역논문

기계 번역을 위한 참조 없는 강화학습 미세 조정: Seq2Seq 관점의 연구

본 연구는 기존 Decoder-only LLM 중심의 강화학습 미세 조정 연구를 넘어, 인코더-디코더(Seq2Seq) 구조인 NLLB-200 모델에 GRPO를 적용한 사례를 다룹니다. 병렬 데이터 없이 LaBSE와 COMET-Kiwi를 활용한 하이브리드 참조 없는 보상 방식을 통해 13개 언어에서 일관된 성능 향상을 확인했습니다. 특히 데이터가 부족한 언어일수록 보상 판별력이 높아져 더 큰 성능 이득을 얻는다는 패턴을 입증했습니다.

arXivAI 번역논문

보정된 가치 페르소나를 통한 교차 문화 설문 시뮬레이션 개선 연구

본 연구는 LLM을 활용한 교차 문화 설문 시뮬레이션 시, 기존의 사회인구학적 페르소나 방식이 가진 한계를 극복하기 위해 가치 기반 페르소나 구축 방법을 제안합니다. 텍스트 기술어를 통해 핵심 문화적 가치를 포착하고 보정 절차를 도입함으로써, 국가 간 예측 오차를 줄이고 과소 대표된 인구 집단의 응답 다양성을 향상시켰습니다.

arXivAI 번역논문

판단 회로(Judge Circuits): LLM의 출력 형식 변화에 따른 평가 불일치 메커니즘 분석

LLM-as-a-judge 패러다임에서 출력 형식의 변화가 평가 결과의 불일치를 유발하는 내부 메커니즘을 분석한 연구입니다. PEAP 기법을 통해 Gemma-3, Qwen2.5, Llama-3 모델 내에서 판단을 담당하는 공통된 '잠재 평가자(Latent Evaluator)' 서브 그래프를 발견했습니다. 연구 결과, 모델은 공유된 계산 경로를 통해 판단 신호를 생성하지만, 이를 출력 형식에 맞게 매핑하는 과정에서 형식 특화적인 브랜치가 개입하여 불일치가 발생함을 밝혀냈습니다.

arXivAI 번역논문

스마트 에너지 인프라를 위한 통합 생성형 AI 프레임워크: 지능형 가스 배분, 공공요금 청구, 탄소 분석 및 양자 영감 최적화

본 논문은 스마트 미터링, 생성형 AI, 그리고 양자 영감 조합 최적화 기술을 결합하여 스마트 에너지 인프라를 관리하는 통합 프레임워크를 제안합니다. 이 프레임워크는 지능형 가스 배분, 공공요금 청구, 탄소 분석 등 에너지 유틸리티 기업의 핵심 운영 효율성을 높이는 데 중점을 둡니다.

arXivAI 번역논문

평면적 언어 레이블에서 유형론적 사전 정보로: 다국어 음성-음성 번역을 위한 구조화된 언어 조건화 기술

기존의 S2ST 시스템이 언어 정보를 단순한 평면 임베딩으로 처리하여 언어 간 구조적 관계를 놓치는 문제를 해결하기 위해 S2ST-Omni 2 프레임워크를 제안합니다. 이 모델은 유형론적 사전 정보를 활용하여 계층적 언어 인코딩, 동적 게이트 방식의 Dual-CTC, 유형론 인지 LLM 프롬프팅을 통해 다국어 적응 성능을 높였습니다. 실험 결과, 적은 양의 데이터로도 우수한 번역 성능을 보이며 데이터 효율적인 다국어 S2ST 가능성을 입증했습니다.

arXivAI 번역논문

추론기인가 번역기인가? 세법 분야의 오염 인지 평가 및 신경-기호적(Neuro-Symbolic) 강건성 연구

본 연구는 LLM의 세법 추론 능력이 실제 추론인지 아니면 데이터 오염에 의한 결과인지 분석합니다. 연구 결과, 단일 LLM보다 법률 조문을 형식적 표현으로 변환하여 기호적 솔버와 결합한 신경-기호적(Neuro-Symbolic) 하이브리드 시스템이 미학습 문서에 대한 일반화와 신뢰성 측면에서 더 우수함을 입증했습니다.

arXivAI 번역논문

DebiasRAG: 검색 증강 생성(RAG)을 통한 대규모 언어 모델의 공정성 확보를 위한 튜닝 프리(Tuning-free) 방법론

DebiasRAG는 대규모 언어 모델(LLMs)의 사회적 편향 문제를 해결하기 위해 제안된 튜닝 프리(tuning-free) 방식의 RAG 프레임워크입니다. 미세 조정 없이도 모델의 고유한 표현 능력을 보존하면서, 쿼리 특정적인 편향 제거 컨텍스트를 생성하고 재순위화하여 공정성을 높입니다. 이를 통해 인종, 성별, 연령 등과 관련된 편향된 응답을 효과적으로 완화합니다.

이전7 / 42전체 42페이지 중 7페이지다음