Insights

AI가 자동으로 큐레이션·번역·정리하는 기술 동향 피드입니다.

arXiv cs.LG 2000건필터 해제

arXiv논문

강체 객체를 위한 행동 조건부 및 객체 중심 Gaussian Splatting 월드 모델 학습

강체 객체의 행동 조건부 역학을 학습하는 새로운 월드 모델인 MRO-GWM을 제안합니다. 객체 중심 Gaussian Splatting과 시공간 트랜스포머를 활용하여 다중 객체 장면의 미래 운동을 예측합니다.

6월 2일0

arXiv논문

무작위 최소제곱 가치 반복 (Randomized Least Squares Value Iteration) 자체는 결합 차분 프라이버시

본 연구는 RLSVI 알고리즘을 활용하여 에피소드 설정 하에서의 프라이버시 보존 강화학습을 조사합니다. 무작위 탐색 과정에서 발생하는 노이즈가 결합 차분 프라이버시를 어떻게 제공하는지 분석하고 수학적으로 증명합니다.

6월 2일0

arXiv논문

Open-Set Test-time Adaptation에서의 In-Distribution 대 Out-of-Distribution 정확도에 대한

Open-set Test-time Adaptation(TTA) 환경에서 In-distribution(InD) 정확도와 Out-of-distribution(OOD) 탐지 능력 사이의 관계를 분석합니다. CIFAR-10-C 및 ImageNet-C 벤치마크를 통해 기존 방법론들의 한계를 검증하고 새로운 베이스라인을 제안합니다.

6월 2일0

arXiv논문

함수 공간 변분 추론을 위한 흐름 변환 암시적 프로세스 (Flow-Transformed Implicit Processes)

본 논문은 함수 공간 모델링에서 사후 추론의 한계를 극복하기 위한 FTIP(Flow-Transformed Implicit Processes)를 제안합니다. 기존 가우시안 변분 분포의 한계를 넘어 정규화 흐름을 활용해 비대칭적이고 다봉적인 사후 분포를 효과적으로 포착합니다.

6월 2일0

arXiv논문

차량 경로 문제(VRP)를 위한 그래프 편집 거리(GED) 정식화: 이론 및 분석

차량 경로 문제(VRP)를 그래프 편집 거리(GED) 최대화 문제로 재정식화하는 새로운 이론적 접근법을 제안합니다. 이를 통해 에지 수준의 구조적 분석과 최적성 격차 분해가 가능해지며, GNN 기반 에지 예측 연구를 위한 토대를 마련합니다.

6월 2일0

arXiv논문

텍스트 가이드 이상 탐지를 위한 구조화된 벤치마크: 언어가 의사결정에 영향을 미치지 못할 때

멀티모달 시각-언어 모델의 이상 탐지 성능이 실제 텍스트 가이드에 의한 것인지 검증하기 위해 새로운 벤치마크인 TGAD를 제안합니다. 연구 결과, 현재 모델들은 텍스트 지시를 정확히 반영하지 못하고 시각적 특징에 의존하여 성능이 과장되어 있음을 밝혀냈습니다.

6월 2일0

arXiv논문

MMG2Skill: 에이전트가 야생의 가이드를 자기 진화형 기술로 증류할 수 있는가?

웹상의 비정형 가이드를 에이전트가 실행 가능한 기술로 변환하고 지속적으로 개선하는 MMG2Skill 프레임워크를 제안합니다. 새로운 벤치마크인 MMG2Skill-Bench를 통해 GUI 제어 및 게임 플레이 환경에서 기존 모델 대비 뛰어난 성능 향상을 입증했습니다.

6월 2일0

arXiv논문

소매 제품명을 소비자 가격 범주로 코딩하기 위한 머신러닝: 신뢰도 가중치 기반 Human-in-the-Loop 레이블링을 적용한

노이즈가 많은 소매 제품명을 소비자 가격 범주로 자동 매핑하기 위한 머신러닝 방법론을 제안합니다. Human-in-the-loop 프로토콜과 신뢰도 가중치를 활용하여 레이블링 효율을 높이는 파이프라인을 연구했습니다.

6월 2일0

arXiv논문

시계열 모델에 왜 긴 컨텍스트 윈도우 (Long Context Windows)가 필요한가?

시계열 예측 모델에서 긴 컨텍스트 윈도우가 필요한 이유를 데이터 생성 과정 식별(GPI)과 조건부 예측(CF) 관점에서 분석합니다. 긴 윈도우가 특정 생성 과정에 대한 불확실성을 줄여 예측 성능을 높임을 증명하고, 계산 효율성을 위한 GPI와 CF의 분리 방법을 제안합니다.

6월 2일0

arXiv논문

추론 모델에서의 극단적인 저비트 추론: 실패 모드 및 타겟팅된 복구

저비트 양자화가 대규모 추론 모델(LRM)의 생성 과정에서 발생하는 불안정성과 실패 모드를 분석한 연구입니다. 2비트 추론 시 발생하는 반복 루프 및 경로 오류를 해결하기 위해 FP16 플래닝과 루프 구조 복구 기법을 제안합니다.

6월 2일0

arXiv논문

복잡도 최소화(Complexity Minimization)를 통한 메타 학습(Meta Learning)의 증명 가능한 데이터 스케일링 법칙

사전 학습 데이터 규모가 커질수록 다운스트림 샘플 복잡도가 감소하는 현상을 이론적으로 설명하는 새로운 메타 표현 학습 프레임워크를 제안합니다. 복잡도 최소화 방식을 통해 최악의 경우의 모델 복잡도를 최소화하며, 이를 통해 데이터 스케일링 법칙을 증명합니다.

6월 2일0

arXiv논문

알고리즘 선택 (Algorithm Selection) 모델의 실세계 일반화 능력 평가

알고리즘 선택(AS) 모델이 합성 데이터와 실세계 최적화 환경에서 보여주는 일반화 능력을 평가한 연구입니다. BBOB, CEC 벤치마크와 로보틱스 및 무인 항공기 경로 계획 문제를 통해 도메인 간 전이 성능을 분석했습니다.

6월 2일0

arXiv논문

Chain-of-Thought 추론의 엔트로피 역학 규명

Chain-of-Thought(CoT) 추론 과정에서 엔트로피 역학을 분석하여 불확실성 영역에서 신뢰 영역으로 전환되는 2단계 구조를 규명했습니다. 신뢰 영역의 높은 신뢰성과 중복성을 활용해 학습 없이도 효율적인 조기 종료와 테스트 시간 스케일링이 가능한 CUSUM 프레임워크를 제안합니다.

6월 2일0

arXiv논문

랭킹 대 할당: 다중 뷰 객체 연관에서의 메트릭 불일치

다중 뷰 객체 연관 작업에서 사용되는 랭킹 메트릭(AP, FPR-95)과 실제 할당 목표 사이의 불일치 문제를 분석합니다. Sinkhorn 기반 정규화를 통해 메트릭과 실제 할당 간의 간극을 메우고 성능을 검증하는 방법을 제안합니다.

6월 2일0

arXiv논문

로봇 학습을 위한 세계-작업 분해 (World-Task Factorization)

로봇 학습의 일반화 성능을 높이기 위해 세계(World) 요인과 작업(Task) 요인을 구조적으로 분해하는 방법론을 제안합니다. 베이지안 모델 증거와 AICON 프레임워크를 통해 환경 속성과 작업 논리를 분리하여, 새로운 환경과 작업에 대한 제로샷 일반화 및 하드웨어 전이 성능을 입증했습니다.

6월 2일0

arXiv논문

OpenWebRL: 시각적 웹 에이전트를 위한 온라인 멀티턴 강화학습 (Online Multi-turn Reinforcement

OpenWebRL은 실제 웹사이트 환경에서 온라인 멀티턴 강화학습을 통해 시각적 웹 에이전트를 학습시키는 오픈 프레임워크입니다. 소량의 데이터만으로도 기존 오픈 소스 모델을 능가하며, OpenAI 및 Gemini와 같은 폐쇄적 시스템과 경쟁할 만한 성능을 보여줍니다.

6월 2일0

arXiv논문

RL-ACRGNet: 강화학습 기반 흉부 방사선 보고서 생성 네트워크

RL-ACRGNet은 강화학습을 활용하여 흉부 방사선 보고서 생성을 자동화하는 새로운 인코더-디코더 모델입니다. DenseNet과 LSTM을 결합하고 메트릭 기반 보상 메커니즘을 통해 시각적 특징과 임상적 일관성을 동시에 개선했습니다.

6월 2일0

arXiv논문

배치 제약 조건 하의 희소 센서로부터 불확실성을 고려한 그래프 신경망 기반 도시 온도장 재구성

희소한 센서 배치 제약 조건 하에서 도시 온도장을 재구성하기 위한 불확실성 인식 GNN 프레임워크를 제안합니다. 가우시안 음의 로그 가능도를 활용해 온도장과 예측 불확실성을 동시에 예측하며, 기존 크리깅 방식보다 우수한 성능을 입증했습니다.

6월 2일0

arXiv논문

확률적 블록 모델(Stochastic Block Models)에서의 쿼리 제한적 커뮤니티 복구

2-커뮤니티 확률적 블록 모델(SBM)에서 제한된 쿼리 예산과 노이즈가 있는 환경에서의 정확한 커뮤니티 복구 방법을 연구합니다. 오라클 전용 접근 방식과 서브샘플링된 그래프를 결합한 모델을 비교하며, 적응적 쿼리 전략이 비적응적 방식보다 정보 이론적 한계를 개선함을 증명합니다.

6월 2일0

arXiv논문

불확실성 정량화 (Uncertainty Quantification)를 통한 오류 예측에서의 모호성의 역할

본 논문은 LLM의 오류 예측 성능을 높이기 위해 불확실성 정량화(UQ) 신호에서 입력의 모호성을 분리하는 방법을 제안합니다. 실험 결과, 모호성 정보를 활용함으로써 다양한 모델과 데이터셋 환경에서 오류 예측 점수를 크게 향상시켰습니다.

6월 2일0

이 피드 구독하기

RSSFeedly, Inoreader 등으로 구독

API/api/search?q=검색어

AIllms.txt로 AI 크롤링 가이드