본문으로 건너뛰기

© 2026 Molayo

Insights

AI가 자동으로 큐레이션·번역·정리하는 기술 동향 피드입니다.

arXiv cs.AI 2159필터 해제

arXiv논문

PhenoYieldNet: 다중 작물 수확량 예측을 위한 작물 인지적 생육 단계 반응 학습

PhenoYieldNet은 작물의 생육 단계 반응을 명시적으로 모델링하여 다중 작물의 수확량을 예측하는 새로운 프레임워크입니다. CPB와 CPA 모듈을 통해 작물별 생육 패턴을 학습하며, 사전 학습된 파운데이션 모델을 자기 지도 학습 방식으로 적응시켜 높은 일반화 성능을 구현했습니다.

5월 25일0
arXiv논문

알려지지 않은 유효 차원을 가진 실용적 베이지안 최적화를 위한 자동화된 랜덤 임베딩

고차원 베이지안 최적화의 차원의 저주 문제를 해결하기 위해 유효 차원을 자동으로 결정하는 DSEBO 알고리즘을 제안합니다. DSEBO는 낮은 차원에서 시작해 수렴 상태에 따라 차원을 동적으로 확장하며 최적화 성능을 높입니다.

5월 25일0
arXiv논문

시각-언어 데이터셋 증류를 위한 멀티모달 분포 매칭 (Multimodal Distribution Matching)

대규모 시각-언어 데이터셋을 효율적으로 압축하기 위한 멀티모달 분포 매칭(MDM) 프레임워크를 제안합니다. 데이터, 모델, 손실 수준에서 기하학적 인지를 통합하여 연산 비용을 줄이면서도 모달 간 정렬 품질을 유지합니다.

5월 25일1
arXiv논문

EDGE-OPD: 증거 기반 온폴리시 증류(Evidence Guided On-Policy Distillation)를 통한 특권

본 논문은 온폴리시 자기 증류(OPSD) 과정에서 발생하는 부작용을 해결하기 위한 EDGE-OPD 방법론을 제안합니다. 가이드된 롤아웃과 증거 마스크를 통해 특권 컨텍스트를 효과적으로 전이하면서도 모델의 일반적인 능력을 보존하는 연구를 다룹니다.

5월 25일1
arXiv논문

VACE: 시계열 이상 탐지를 위한 기하학적 구조를 갖춘 표현 학습

VACE는 다변량 시계열 이상 탐지를 위해 정상 데이터의 기하학적 구조를 명시적으로 제어하는 새로운 자기지도 학습 방법론을 제안합니다. 속도 일관성 목적 함수를 통해 정상 궤적을 조밀하고 정렬된 형태로 학습하여, 기존 대조 학습 방식의 한계를 극복하고 SOTA 성능을 달성했습니다.

5월 25일0
arXiv논문

DrawVideo: 스토리보드 키프레임 스케치를 이용한 긴 영상 생성

DrawVideo는 스케치 가이드와 스토리보드를 활용하여 제어 가능한 긴 영상을 생성하는 새로운 프레임워크를 제안합니다. 샷을 스케치, 외형, 움직임 프롬프트로 분해하여 구조적 제어력과 시각적 일관성을 동시에 확보합니다.

5월 25일1
arXiv논문

Precise: Flow-Matching 모델의 RL 사후 학습을 위한 SDE-일관적 확률적 샘플링

Flow-matching 모델의 강화학습(RL) 성능을 높이기 위해 SDE-일관적 확률적 샘플링 기법인 Precise를 제안합니다. 탐색과 안정성의 균형을 맞추는 SDE 스케줄과 이산화 노이즈를 최소화하는 근사법을 통해 보상 최적화 속도를 획기적으로 개선했습니다.

5월 25일0
arXiv논문

RA-DCA: Max-구조 DC 프로그램의 방향적 정지 상태를 위한 무작위 활성 집합 DCA

비매끄러운 차분 볼록(DC) 프로그램의 효율적인 해결을 위해 제안된 RA-DCA 알고리즘을 소개합니다. 무작위 활성 집합 샘플링과 선형 계획법을 결합하여, 계산 비용을 줄이면서도 확률 1로 방향적 정지 상태에 수렴함을 증명했습니다.

5월 25일0
arXiv논문

모든 것을 한 번에 학습하는 목표 조건부 에이전트 (Goal-Conditioned Agents that Learn Everything All

모든 목표를 한 번에 학습하는 LEO(Learning Everything all at Once) 방식을 제안합니다. 단일 네트워크 통과만으로 모든 목표에 대한 병렬 업데이트를 가능하게 하여, 기존 재라벨링 방식 대비 250배 이상의 속도 향상을 달성했습니다.

5월 25일1
arXiv논문

PathNavigate: 전체 슬라이드 이미지(WSI) VQA를 위한 놀라움 기반 스캔 및 공유 슬라이드 메모리를 갖춘 학습

PathNavigate는 기가픽셀 규모의 전체 슬라이드 이미지(WSI)에서 효율적인 시각적 질의응답을 수행하는 학습 불필요(Training-free) 병리 에이전트입니다. 놀라움 기반 스캔과 공유 슬라이드 메모리를 활용하여 질문에 명시되지 않은 형태학적 특징까지 효과적으로 탐색합니다.

5월 25일0
arXiv논문

CP인가 DP인가? 둘 다 하면 안 될까: 부분 작업 스케줄링 문제(PSSP)에 대한 사례 연구

본 논문은 조합 최적화 문제를 해결하기 위해 동적 계획법(DP)과 제약 프로그래밍(CP)을 결합한 하이브리드 접근 방식을 제안합니다. 부분 작업 스케줄링 문제(PSSP)를 사례로, DP를 탐색 프레임워크로, CP를 제약 전파 서브루틴으로 활용하여 유연성과 효율성을 입증했습니다.

5월 25일0
arXiv논문

순차적 강화학습 (Sequential Reinforcement Learning)에서의 목표 일반화 이해

순차적 강화학습 에이전트가 새로운 환경에서 어떻게 목표를 일반화하는지 분석한 연구입니다. 100개 이상의 훈련 파이프라인을 통해 특징적 요소가 일반화를 주도함을 밝히고, 잠재 정책 경사(latent policy gradients) 방법론을 통해 분포 외 행동을 예측합니다.

5월 25일0
arXiv논문

ARMS: 희소 보상 다중 에이전트 강화학습을 위한 자동 보상 형성 (Automatic Reward Shaping)

MARL의 희소 보상 문제를 해결하기 위해 궤적 순위 지정과 조건부 최적 대응 추론을 활용한 ARMS 프레임워크를 제안합니다. 이 방식은 내쉬 균형을 보존하면서 조밀한 보상 신호를 자동으로 형성하여 학습 효율을 높입니다.

5월 25일0
arXiv논문

HARNESS-LM: Sponsored Search Retrieval에서 SLM을 활용하기 위한 3단계 학습 레시피

Sponsored Search Retrieval 분야에서 소형 언어 모델(SLM)의 성능을 극대화하는 HARNESS-LM 학습 방법론을 제안합니다. 지식 증류, 도메인 특화 적응, 정렬의 3단계 과정을 통해 SLM이 LLM에 근접한 검색 성능을 내도록 설계되었습니다.

5월 25일1
arXiv논문

Co-ReAct: ReAct 에이전트를 위한 단계별 협업 도구로서의 루브릭 (Rubrics)

Co-ReAct는 ReAct 에이전트의 추론 과정에서 루브릭을 단계별 가이드로 활용하는 새로운 프레임워크를 제안합니다. GRPO를 통해 변별력 있는 루브릭 생성기를 훈련하며, 기존 모델의 결정 메커니즘을 유지하면서도 검색 및 추론 성능을 크게 향상시킵니다.

5월 25일0
arXiv논문

항공기 해체 스케줄링 문제 해결

항공기 해체 과정의 수익성을 높이기 위해 복잡한 스케줄링 문제를 해결하는 연구를 다룹니다. 제약 프로그래밍(CP)과 혼합 정수 계획법(MIP) 모델을 제안하여 실제 산업 데이터를 기반으로 효율적인 작업 순서와 자원 배분을 최적화합니다.

5월 25일1
arXiv논문

메타 러닝 (Meta-Learning)을 통한 비용 효율적인 모델 평가

새로운 모델을 레이블이 없는 데이터로 빠르고 비용 효율적으로 평가하기 위한 MetaEvaluator 프레임워크를 제안합니다. 메타 러닝을 활용해 모델별 재학습 없이도 다양한 아키텍처와 모달리티에 적용 가능한 모델 불가지론적 평가 방식을 제공합니다.

5월 25일0
arXiv논문

Preisach Attention: 순차적 메모리의 이력 현상 모델

수리 물리학의 Preisach 이력 현상 모델을 활용한 새로운 시퀀스 모델링 아키텍처인 Preisach Attention Layer(PAL)를 제안합니다. PAL은 기존 softmax 어텐션을 대체하여 국소 극값 스택을 통해 효율적인 메모리 관리를 수행하며, 트랜스포머와 차별화된 계산 능력을 증명합니다.

5월 25일0
arXiv논문

DiLaDiff: 언어 모델링을 위한 증류된 잠재 증강 확산 모델 (Distilled Latent-Augmented Diffusion for

DiLaDiff는 확산 언어 모델의 샘플링 품질과 처리량 간의 트레이드오프를 해결하기 위해 제안된 새로운 모델입니다. 연속적 잠재 공간, 잠재 확산 모델, 그리고 일관성 모델을 결합하여 추론 속도를 가속화하고 성능을 개선합니다.

5월 25일0
arXiv논문

EM-Vid: 효율적이고 일관된 멀티샷 비디오 생성을 위한 훈련 불필요 엔티티 중심 메모리

멀티샷 비디오 생성 시 엔티티의 일관성을 유지하기 위해 엔티티 중심 메모리(EM-Vid)를 제안합니다. 전체 프레임을 저장하는 대신 엔티티 인덱스 뱅크를 활용하여 계산 비용을 줄이고 정보 누출을 방지합니다.

5월 25일0

이 피드 구독하기

본 페이지의 콘텐츠는 AI가 공개된 소스를 기반으로 자동 수집·요약·번역한 것입니다. 원 저작권은 각 원저작자에게 있으며, 각 게시물의 “원문 바로가기” 링크를 통해 원문을 확인할 수 있습니다. 저작권자의 삭제 요청이 있을 경우 신속히 조치합니다.