본문으로 건너뛰기

© 2026 Molayo

Insights

AI가 자동으로 큐레이션·번역·정리하는 기술 동향 피드입니다.

arXiv논문

온폴리시 증류 (On-Policy Distillation)를 위한 블록 단위 정책 드리프트 게이팅 (Blockwise Policy-Drift

온폴리시 증류(OPD) 과정에서 긴 추론 작업의 성능을 높이기 위해 블록 단위 정책 드리프트 게이팅 기법을 제안합니다. 학생 모델의 로그 확률 변화량을 블록 단위로 집계하여 손실 가중치를 재조정함으로써 수학 추론 성능을 향상시킵니다.

3일 전0
arXiv논문

NeuroSonic: EEG-to-Speech 재구성을 위한 조건부 흐름 매칭 (Conditional Flow Matching)

NeuroSonic은 EEG 신호를 기반으로 연속적인 음성을 재구성하는 조건부 흐름 매칭(Conditional Flow Matching) 프레임워크입니다. 결정론적 확률 흐름 속도장을 학습하여 기존 확산 모델의 불안정성을 극복하고 음성 재구성의 품질을 크게 향상시켰습니다.

3일 전0
arXiv논문

PORTER: 휴대 가능한 구조화된 EHR 파운데이션 모델을 위한 언어 기반 이벤트 표현

PORTER은 고정된 어휘 집합 대신 언어 기반 설명을 사용하여 임상 이벤트를 표현하는 EHR 파운데이션 모델입니다. 수치 값 통합과 시계열 백본을 통해 새로운 개념에 대한 유연한 대응과 높은 전이 학습 성능을 보여줍니다.

3일 전0
arXiv논문

다중 목적 강화학습 (Multi-Objective Reinforcement Learning)을 통한 LLM 사전 학습용 통합 데이터 스케줄러

LLM 사전 학습 시 데이터 혼합을 최적화하기 위한 새로운 프레임워크인 HDS를 제안합니다. 다중 목적 강화학습(SAC)을 활용하여 데이터 품질, 손실, 모델 가중치를 통합적으로 고려한 스케줄링을 수행합니다.

3일 전0
arXiv논문

Top-1이 실패할 때: Masked Diffusion LM을 위한 LoRA 모니터 보정

이산 확산 언어 모델(DLM)의 LoRA 미세 조정 시 기존의 top-1 집중도 모니터링이 실제 모델 붕괴를 예측하지 못하는 문제를 분석합니다. 연구팀은 이를 해결하기 위해 max LoRA 그래디언트 노름을 활용한 새로운 보정 방법을 제안합니다.

3일 전0
arXiv논문

FedUP: 중심점 유도형 플러그인 필터를 활용한 원샷 연합 언러닝 (One-Shot Federated Unlearning)

FedUP은 연합 언러닝(Federated Unlearning) 과정에서 발생하는 지식 손실과 지연 시간 문제를 해결하기 위한 새로운 프레임워크입니다. 플러그형 필터를 사용하여 모델 성능을 보존하면서도 단 몇 초 만에 대상 데이터를 제거할 수 있는 효율적인 방식을 제안합니다.

3일 전0
arXiv논문

AsyncOPD: 온폴리시 증류(On-Policy Distillation)는 얼마나 오래된 데이터를 허용할 수 있는가?

비동기식 온폴리시 증류(OPD) 환경에서 발생하는 데이터 노후화(staleness) 문제를 체계적으로 분석한 연구입니다. KL 방향에 따른 강건성 차이를 규명하고, 학습 처리량을 최대 3.8배 향상시킨 비동기식 학습 파이프라인 AsyncOPD를 제안합니다.

3일 전0
arXiv논문

이산 흐름 매칭 (Discrete Flow Matching)을 위한 시간 재매개변수화된 누적 강도 외삽 샘플러

이산 흐름 매칭(DFM)의 효율적인 샘플링을 위해 제안된 TR-CIE 샘플러에 관한 연구입니다. 시간 재매개변수화와 누적 강도 외삽 기술을 통해 추가적인 모델 평가 없이도 제한된 NFE 환경에서 샘플링 품질을 크게 향상시킵니다.

3일 전0
arXiv논문

BehaviorBench: 행동 과학 태스크를 위한 파운데이션 모델(Foundation Models) 벤치마킹

행동 과학 태스크를 평가하기 위한 종합 벤치마크인 BehaviorBench와 미세 조정된 모델인 Be.FM-1.5를 소개합니다. 이 연구는 모델이 개인의 행동뿐만 아니라 인구 집단 수준의 분포를 얼마나 잘 정렬하는지 평가하는 데 중점을 둡니다.

3일 전0
arXiv논문

온디바이스 결함 탐지를 위한 경량 Transformer 모델: 자원 제한적 배포에 관한 벤치마크 연구

자원 제한적인 온디바이스 환경에서 결함 탐지를 위한 경량 Transformer 모델과 전통적 ML 방법론의 성능을 비교 분석한 벤치마크 연구입니다. 모델 크기, 지연 시간, 정확도 간의 트레이드오프를 평가하며 양자화 및 적응형 추론 파이프라인의 효과를 검증합니다.

3일 전0
arXiv논문

자기 진화형 월드 모델을 위한 반사실적 제어 가능성을 갖춘 자율 비디오 생성

비디오 생성 모델이 단순한 시각적 예측을 넘어, 반사실적 제어 가능성을 갖춘 자기 진화형 월드 모델로 나아가야 함을 제안합니다. 특정 행동에 따른 미래를 예측하고 신체화 제약을 검증하며, 이를 다시 생성 과정에 피드백하는 메커니즘을 강조합니다.

3일 전0
arXiv논문

Project Ariadne: 합성 계획을 위한 프롬프트 조건부 경로 생성

Ariadne는 목표 분자와 제약 조건을 하나의 프롬프트로 처리하는 디코더 전용 역합성 경로 생성 모델입니다. 기존 방식과 달리 단일 모델로 다양한 계획 사양을 지원하며, 벤치마크 결과 기존 플래너 대비 높은 효율성과 성능을 입증했습니다.

3일 전0
arXiv논문

고차원 스펙트럼 노름 볼(Spectral Norm Balls)에서의 균등 샘플링

단위 스펙트럼 노름 볼에서 행렬을 균등하게 샘플링할 때 발생하는 특이값의 수렴 현상을 다룹니다. 행렬 차원이 커질수록 모든 특이값이 1로 수렴함을 증명하여 대규모 언어 모델의 행렬 특성을 이론적으로 뒷받침합니다.

3일 전0
arXiv논문

인도 언어 처리를 위한 파니니(Pāninian) 기반 체계

인도 언어들의 공통된 형태통사적 구조인 파니니(Pāninian) 프레임워크를 활용하여 파편화된 NLP 인프라를 통합하는 연구를 제안합니다. 이를 통해 데이터 효율성을 높이고, 통합된 계산 아키텍처와 벤치마크를 통해 언어 간 전이 학습을 강화하고자 합니다.

3일 전0
arXiv논문

3D 인지 기하학적 제약 조건을 활용한 오픈 보카블러리 (Open-Vocabulary) BEV 세그멘테이션

자율 주행을 위한 오픈 보카블러리 BEV 세그멘테이션 프레임워크인 OVBEVSeg를 제안합니다. 3D 기하학적 제약 조건과 가우시안 스플래팅을 활용하여 2D VLM의 시맨틱스를 BEV로 정밀하게 투영하며, 기존 폐쇄 집합 방식보다 높은 성능과 효율성을 입증했습니다.

3일 전0
arXiv논문

배터리 없는 IoT의 미지의 워크로드를 위한 작업 실행 관리: 하드웨어 불가지론적 평가

배터리 없는 에너지 수확 IoT 시스템을 위한 하드웨어 불가지론적 동적 스케줄링 전략을 제안합니다. RL 에이전트와 즉석 근사 예측(AP) 방식을 통해 예측 불가능한 워크로드와 변동성 큰 에너지 환경에서 효율적인 작업 실행 관리를 연구했습니다.

3일 전0
arXiv논문

레짐 스위칭(regime-switching) 순방향 효용(forward utilities)에 대한 응용을 포함한 에르고딕 BSDE 시스템을

레짐 스위칭 확률 인자 모델 내 순방향 효용 프레임워크를 해결하기 위한 에르고딕 BSDE 시스템과 두 가지 신경망 기반 수치 기법을 제안합니다. 국소 가산 딥러닝과 딥 갈레르킨 방법(DGM)을 활용하여 최적 전략 근사를 수행합니다.

3일 전0
arXiv논문

PHANTOM: 시각-언어 모델 (VLMs)을 위한 대규모 멀티모달 적대적 공격 데이터셋

시각-언어 모델(VLMs)의 안전성과 강건성을 평가하기 위한 대규모 멀티모달 적대적 공격 데이터셋인 PHANTOM을 소개합니다. 10개의 상위 카테고리와 55개의 하위 카테고리를 포함한 47,524개의 적대적 샘플을 제공하여 연구자들이 모델의 취약점을 체계적으로 테스트할 수 있도록 돕습니다.

3일 전0
arXiv논문

MotifGen: 다중 소스 생성 모델링을 통한 정렬되지 않은 위성 이미지의 시공간적 보간 — 열대 저기압 적용 사례

MotifGen은 불규칙한 시간 간격과 이질적인 다중 소스 데이터를 처리하는 새로운 생성 모델입니다. 열대 저기압의 마이크로파 및 적외선 위성 영상을 시공간적으로 보간하여 관측 공백을 메우는 데 탁월한 성능을 보입니다.

3일 전0
arXiv논문

PROTECT-90: 전력 계통 보호를 위한 고장 데이터셋

전력 계통 보호 연구를 위한 표준화된 고전압 파형 데이터셋인 PROTECT-90을 소개합니다. 90 kV 이중 선로 토폴로지에서 생성된 9,022개의 시뮬레이션 에피소드를 포함하며, 재현 가능한 벤치마킹을 위한 물리적 근거와 메타데이터를 제공합니다.

3일 전0

이 피드 구독하기

본 페이지의 콘텐츠는 AI가 공개된 소스를 기반으로 자동 수집·요약·번역한 것입니다. 원 저작권은 각 원저작자에게 있으며, 각 게시물의 “원문 바로가기” 링크를 통해 원문을 확인할 수 있습니다. 저작권자의 삭제 요청이 있을 경우 신속히 조치합니다.