Insights

AI가 자동으로 큐레이션·번역·정리하는 기술 동향 피드입니다.

저품질 데이터 기반 다중 모달 학습을 위한 확률적 예측 자기 보정 (Conformal Predictive Self-Calibration

본 논문은 모달 불균형 및 노이즈 교란과 같은 저품질 데이터 문제를 해결하기 위해 '확률적 예측 자기 보정(Conformal Predictive Self-Calibration, CPSC)'이라는 통합 프레임워크를 제안합니다. CPSC는 모델이 학습 과정에서 실시간으로 자체적으로 신뢰성을 점검하고 보정할 수 있도록 설계되었으며, 특히 표현 자기 보정과 그래디언트 자기 보정을 결합한 새로운 자기 보정 학습 루프가 핵심입니다. 이 프레임워크는 다양한 벤치마크 데이터셋에서 기존 방법들보다 우수한 성능을 입증했습니다.

5월 6일7

arXiv논문

확산 모델 기후 에뮬레이터로부터 정확한 극단 사건 확률 계산

본 기사는 확산 모델(Diffusion Model)인 Climate in a Bottle (cBottle)이 ML 기반 기후 에뮬레이터에서 대기 상태를 생성하는 방법을 다룹니다. cBottle는 열대성 사이클론(TCs)과 같은 극단 기상 사건을 효과적으로 생성하도록 안내할 수 있습니다. 특히, 이 모델의 확률 밀도 추정치를 활용하여 특정 극단 사건이 발생할 확률을 정량적으로 계산하고, 이를 통해 기존 몬테카를로 샘플링 대비 정확도를 높이는 방법을 제시합니다.

5월 6일6

arXiv논문

일반적인 거리 손실 (Metric Losses) 에 대한 실현 가능한 Bayes-Consistency 강건성 연구

본 논문은 일반적인 거리 손실을 가진 실현 가능한(realizable) 설정에서 강력한 보편적 Bayes-consistency를 연구하며, 기존의 분류 및 실수값 회귀 문제를 넘어선 고전적인 특징화를 제시합니다. 저자들은 모든 실현 가능한 데이터 생성 분포에 대해 위험이 가장 좋은 클래스 내 위험(0)으로 거의 확실하게 수렴하는 분포 독립적 학습 규칙이 존재하는 가설 클래스 $\mathcal H$에 대한 필요충분 조건을 찾습니다. 주요 기여로는 Littlestone 트리를 거리 손실 설정으로 확장한 무한 증가 $(\gamma_k)$-Littlestone 트리가 있습니다.

5월 6일8

arXiv논문

고성능 모바일 NPU 를 위한 지식 증류 기반 실용 이미지 노이즈 제거

본 논문은 모바일 NPU 환경에 최적화된 실용적인 이미지 노이즈 제거 모델을 제안합니다. 고성능의 Teacher 네트워크 지식을 경량화된 Student 네트워크로 증류하는 '하드웨어 인식 지식 증류' 방법을 사용하며, 이는 모바일 SoC의 타일 메모리 구조와 NPU 네이티브 연산자(3x3 컨볼루션 등)를 적극적으로 활용합니다. 그 결과, 파라미터 수를 획기적으로 줄이면서도 높은 복원 품질을 유지하고, 전용 NPU 실행 시 통합 GPU 대비 월등히 빠른 추론 속도를 달성하여 모바일 AI 배포의 실용성을 크게 향상시켰습니다.

5월 6일11

arXiv논문

ICU 시계열 데이터의 모델 이식성을 평가하는 도메인 인크리멘탈 지속 학습 벤치마크

본 연구는 대형 병원에서 훈련된 머신러닝 모델을 지역적 특성이 다른 소규모 병원으로 이식할 때 발생하는 일반화 능력 문제를 다룹니다. 이를 해결하기 위해, 미국 전역의 다양한 지역 간 데이터 분포 차이를 반영하여 모델의 '도메인 인크리멘탈 지속 학습' 능력을 평가하는 새로운 벤치마크를 제안합니다. 이 벤치마크는 모델이 새로운 도메인의 정보를 효과적으로 흡수하면서도 기존 지식을 유지할 수 있는 방법을 검증하며, 데이터 리플레이와 EWC 같은 주요 지속 학습 기법들을 비교 평가합니다.

5월 6일7

arXiv논문

제로차 순화 (Zeroth-Order Optimization) 의 적응성 연구: 메모리 효율적 최적화기 제안

본 논문은 메모리 제약이 있는 대규모 언어 모델(LLM)의 미세 조정 과정에서 적응형 제로차(ZO) 최적화 기법의 효율성을 연구했습니다. 기존 방식들이 주장하는 것과 달리, 저자들은 ZO-Adam 같은 적응형 방법이 수렴에 이점을 주지 않으면서도 메모리 오버헤드를 유발함을 입증했습니다. 이에 따라, 전역 스텝 크기 적응을 단일 스칼라로 추적하여 메모리 효율성을 극대화한 새로운 최적화기 MEAZO를 제안하고, 이론적 수렴 보장과 광범위한 실험을 통해 그 우수성을 검증했습니다.

5월 6일8

arXiv논문

복잡수 영역에서의 기호 회귀: 기울기 하강법과 복소수 계수 확장

본 논문은 기존의 기울기 기반 기호 회귀 모델들이 로그나 제곱근 같은 연산자 사용 시 발생하는 실수 영역의 극점(pathologies) 문제에 직면하는 한계를 지적합니다. 이를 해결하기 위해, 연구진은 복소수 계수를 확장한 Equation Learner를 제안했습니다. 이 새로운 접근법은 목표 표현이 실수 영역에서 극점을 가지더라도 안정적으로 수렴하며, 다양한 연산자를 제약 없이 사용하여 더 넓고 정확한 가설 클래스를 탐색할 수 있게 합니다.

5월 6일9

arXiv논문

CLIP 모델 기반 메모리 효율적 지속 학습

본 논문은 CLIP 모델이 새로운 데이터에 적응할 때 발생하는 재앙적 망각 문제를 해결하기 위한 메모리 효율적인 지속 학습 방법을 제안합니다. 기존 방식들이 메모리 버퍼 크기에 민감하고 이전 지식 손실을 초래하는 한계를 극복하고자 합니다. 연구진은 훈련 과정에서 각 클래스별로 손실을 동적으로 재가중치화하는 새로운 접근법을 제시하여, 최소한의 메모리 사용으로도 CLIP 모델의 성능 저하를 효과적으로 방지했습니다.

5월 6일6

arXiv논문

EEG 신호의 공간시간적畳み込み: 효율적이고 설명 가능한 EEG 분류를 위한 심층 신경망의 표현 학습 관점

본 논문은 EEG 신호 분류를 위해 기존의 1D CNN 방식 대신 공간시간적 2D 컨볼루션을 적용하는 대안적인 접근법을 제시한다. 저차원 및 고차원 BCI 운동상상 분류 작업을 통해 테스트한 결과, 2D 컨볼루션이 특히 고차원 데이터에서 성능을 유지하면서도 훈련 시간을 크게 단축시키는 것을 확인했다. 연구진은 이 결과를 바탕으로 2D CNN 계층을 통합한 개선된 모델을 제안하며, 복잡한 다변량 신호 처리 시 구조적 인코딩의 중요성을 강조한다.

5월 6일10

arXiv논문

표본 마르코프 결정 과정 (MDP) 의 최적 후속 샘플링을 통한 정책 식별

이 논문은 유한 시간 간격의 에피소드 마르코프 결정 과정(MDP)에서 $(\varepsilon, \delta)$-PAC 정책 식별 문제를 다룹니다. 기존 방법들이 높은 계산 비용이나 최적 의존성 문제점을 가졌던 것과 달리, 연구진은 후속 샘플링과 온라인 학습 알고리즘을 결합한 새로운 접근 방식을 제안했습니다. 이 방법은 샘플 복잡성과 후속 수축률 측면에서 점근적 최적성을 달성하며, 계산 효율성이 높고 $\log(1/\delta)$에 대한 비최적 다항식 의존성을 피하는 것이 주요 강점입니다.

5월 6일9

arXiv논문

HeadsUp: 대규모 멀티뷰 캡처에서 고품질 3D 가우스 헤드 복원

HeadsUp은 대규모 멀티카메라 설정에서 고품질 3D 가우스(Gaussian) 형태의 인간 머리를 복원하기 위한 확장 가능한 피드포워드 방법을 제안합니다. 이 방법은 입력 이미지를 컴팩트한 잠재 표현으로 압축하고, 이를 중립 헤드 템플릿에 기반하여 UV 파라미터화된 3D 가우스 집합으로 디코딩하는 효율적인 인코더-디코더 아키텍처를 사용합니다. HeadsUp은 대규모 데이터셋에서 최첨단 복원 품질을 달성하며, 테스트 시간 최적화 없이 새로운 정체성에 일반화되는 강력한 성능을 보여줍니다.

5월 6일8

arXiv논문

차분 프라이버시 (Differential Privacy) 에 특성 상관관계 통합 및 DP-ERM 적용

본 논문은 기존 차분 프라이버시(Differential Privacy, DP)가 모든 특성에 균일한 제약을 가하는 한계를 지적하고, 특정 특성 간의 상관관계 이질성을 고려한 완화된 DP 정의를 도입합니다. 연구진은 총 변동 거리(total variation distance)를 사용하여 이러한 상관관계를 정량화하고, 이를 활용하여 비민감한 특자에 대한 프라이버시 제약을 완화하는 '상관관계 인식 차분 프레임워크($ ext{CorrDP}$)'를 제안합니다. 이 $ ext{CorrDP}$를 기반으로 하는 DP-ERM 알고리즘은 기울기에 거리 의존성 노이즈를 적용하여 이론적 유틸리티를 향상시키며, 실제 데이터셋 실험을 통해 표준 DP보다 우수한 성능을 입증했습니다.

5월 6일9

arXiv논문

PALACE: 데이터 적응형 커널을 통한 인증된 포인트 클라우드 및 그래프 분류

PALACE(Persistence Adaptive-Landmark Analytic Classification Engine)는 데이터 적응형 커널을 활용하여 포인트 클라우드 및 그래프 분류의 성능을 향상시킨 새로운 방법론입니다. 이 엔진은 세 가지 나뉜 값에 대한 작은 교차 검증 계층을 지불하며, 레베그 수 기준 기반의 커버 이론적 핵심을 통해 네 가지 강력한 폐쇄형 보장(closed-form guarantees)을 제공합니다. 실험 결과, PALACE는 Orbit5k, COX2, MUTAG 등 여러 데이터셋에서 기존의 다이어그램 기반 방법론들을 능가하는 우수한 성능을 입증했습니다.

5월 6일6

arXiv논문

조건부 확산 샘플링 (Conditional Diffusion Sampling) 소개

본 기술 기사는 밀도 평가가 제한적인 비정규화 다중 모드 분포에서 샘플링하는 근본적인 문제를 해결하기 위한 새로운 프레임워크인 조건부 확산 샘플링(CDS)을 소개합니다. CDS는 기존의 강력한 글로벌 탐색 방법인 병렬 온도화(PT)와, 연속적 대안을 제공하는 확산 기반 접근 방식을 결합했습니다. 이 방식은 PT를 사용하여 초기 분포에서 효율적으로 샘플링하고, 이후 조건부 보간자(Conditional Interpolants)가 정의하는 해석적인 확률 미분 방정식(SDE)을 통해 샘플을 전송하여 높은 품질과 낮은 비용의 균형을 달성합니다.

5월 6일12

arXiv논문

애피니티만으로는 부족하다: Mixture-of-Experts 에서 자유 에너지 원리 회복

기존의 Sparse Mixture-of-Experts (MoE) 라우팅은 도메인 전환(domain transitions) 지점에서 성능 저하를 보입니다. 본 연구는 Friston의 Free Energy Principle과 Spiking Neural Networks (SNNs)의 LIF 역학을 기반으로 세 가지 게이트 수정(시간적 기억, 정밀도 가중치, 선제적 라우팅)을 제안합니다. 이 메커니즘들은 특히 도메인 전환 시 올바른 전문가에게 확률 할당을 획기적으로 높여 MoE 모델의 견고성과 효율성을 크게 개선하며, 결합된 게이트는 구조적인 상호작용을 통해 가장 큰 성능 향상을 가져옵니다.

5월 5일10

arXiv논문

통합 전 분리: SFT 및 RLVR 작업 벡터의 추론 시간 합성

본 논문은 대규모 언어 모델(LLM)의 후속 훈련 과정에서 SFT와 RLVR이라는 두 가지 핵심 패러다임을 통합하는 어려움을 다룹니다. 기존 방식들이 재앙적 망각이나 그래디언트 충돌 같은 문제를 겪는 근본적인 이유를 작업 벡터 분석을 통해 밝혀냈습니다. 이를 해결하기 위해, 연구진은 모델 파라미터를 업데이트하지 않고도 추론 시간 합성(inference time synthesis)을 통해 두 패러다임의 능력을 결합하는 새로운 프레임워크인 DoTS(Decoupled Test-time Synthesis)를 제안했습니다.

5월 5일9

arXiv논문

온라인 일반화 예측 코딩 (Online Generalised Predictive Coding)

이 논문은 일반화 필터링의 개념을 확장하여 온라인 데이터 동화(Online Data Assimilation)를 위한 새로운 프레임워크인 온라인 동적 기대 최대화(ODEM) 스키마를 제안합니다. 이 방법론은 시간 규모 분리를 활용하여, 파라미터와 정밀도의 느린 업데이트와 빠른 베이지안 믿음 업데이트를 결합함으로써 비선형적이거나 혼돈적인 생성 모델의 잠재 상태를 효과적으로 추적할 수 있게 합니다.

5월 5일7

arXiv논문

불완전 관측 환경에서의 화학요법 제어에 대한 반복적 심층 강화학습

본 논문은 화학요법 용량 최적화와 같이 불확실성이 높은 동적 치료 체제에서 강화학습을 적용하는 방법을 제시합니다. 기존의 접근 방식들이 완전 관측 환경을 가정하는 한계를 극복하기 위해, 연구진은 기억 증강 정책(memory-augmented policy) 기반의 반복적 TD3 아키텍처를 개발했습니다. 이 방법은 불완전한 환자 상태 관측 및 노이즈가 존재하는 임상 환경에서도 안정적이고 강력한 성능을 보여주었으며, 이는 임상적으로 중요한 상태 정보가 불확실할 때 기억 기반 정책의 유용성을 입증합니다.

5월 5일9

arXiv논문

복합재료 역학의 다중 신뢰도 대리 모델링: 공동 크리깅에서 다중 신뢰도 신경망까지

본 리뷰는 복합재료의 예측 모델링에 사용되는 '다중 신뢰도 대리 모델링(Multi-Fidelity Surrogate Modeling)' 기법을 구조적으로 개괄합니다. 이 방법은 저비용 데이터와 제한된 고정확도 데이터를 결합하여, 복잡하고 비용이 많이 드는 복합재료의 설계 공간 탐색 및 특성 예측에 대한 신뢰할 수 있는 모델링 솔루션을 제공합니다. 논문에서는 공동 크리깅부터 다중 신뢰도 신경망까지 다양한 기법들을 비교하며, 공학적 응용 사례와 향후 연구 과제(예: 제조 이력 의존적 불확실성 전파)를 제시합니다.

5월 5일8

arXiv논문

TRACED: 인간 glioma 환자에서 세포외 내재 확산계수, 난이도, 세포 크기 분포 및 세포 밀도를 생체내 영상화하는 모델

본 논문은 고형종양 조직 미세구조 내 세포외 확산계수, 난이도, 세포 크기 분포 및 세포 밀도를 생체내 영상화하기 위한 새로운 물리 기반 모델인 TRACED를 제안합니다. 이 모델은 세포 분포에 시간 의존성을 통합하여 확산 MRI 신호를 계산하며, 신경망을 사용하여 다양한 세포 크기를 가진 세포 군집의 시간에 따른 확산 특성을 빠르고 정확하게 예측할 수 있습니다. 연구진은 8명의 glioma 환자 데이터를 활용하여 TRACED를 검증했으며, 이 모델이 기존 단순 모델보다 개선된 파라미터 추정치를 제공하고 임상적으로 유용한 다중 물리적 정보를 동시에 정량화할 수 있음을 입증했습니다.

5월 5일6

이 피드 구독하기

RSSFeedly, Inoreader 등으로 구독

API/api/search?q=검색어

AIllms.txt로 AI 크롤링 가이드