Insights
AI가 자동으로 큐레이션·번역·정리하는 기술 동향 피드입니다.
arXiv cs.LG (Machine Learning) 112건필터 해제
생성형 에뮬레이터(Generative Emulators)를 이용한 훈련이 필요 없는 베이지안 필터링 (Bayesian Filtering)
본 연구는 고차원 환경에서 확장성이 떨어지는 기존 파티클 필터의 한계를 극복하기 위해 확산 기반 에뮬레이터(diffusion-based emulators)를 활용하는 새로운 방식을 제안합니다. 별도의 추가 훈련 없이도 동적 시스템의 상태를 추정할 수 있으며, 대기 역학 등 비선형 카오스 시스템 실험을 통해 고차원 환경에서의 성공적인 확장성을 입증했습니다.
받아들이거나 거부하거나: 의도 제어형 부분 최적 운송 (Intent-Controlled Partial Optimal Transport)
본 논문은 기존의 부분 최적 운송(Partial Optimal Transport)이 가진 전역적 거부 방식의 한계를 극복하기 위해, 점별 거부 비용을 도입한 의도 제어형 부분 최적 운송(IC-POT)을 제안합니다. IC-POT는 외부 정보나 측면 신뢰도에 따라 특정 데이터를 선택적으로 거부할 수 있는 구조화된 메커니즘을 제공하며, 이를 통해 Positive-Unlabeled Learning 및 도메인 적응 분야에서 성능을 개선합니다.
CAMERA: 비지도 텍스트 속성 그래프 사기 탐지에서의 의미론적 위장 적응
사기꾼들이 선량한 사용자의 텍스트를 모방하여 탐지를 피하는 '의미론적 위장' 문제를 해결하기 위한 비지도 학습 기반의 TAGFD 프레임워크인 CAMERA를 제안합니다. CAMERA는 에고-디커플링 혼합 전문가(MoE) 구조와 문맥 정보 기반 게이팅 모델을 통해 다양한 사기 지표를 적응적으로 통합합니다. 실험 결과, CAMERA는 위장된 사기꾼을 탐지하는 데 있어 기존 모델보다 뛰어난 성능을 입증했습니다.
D$^3$-Subsidy: 대규모 차량 호출 시장을 위한 온라인 및 순차적 드라이버 보조금 의사결정
DiDi Chuxing은 차량 호출 플랫폼의 드라이버 보조금을 최적화하기 위해 계층적 확산 기반 프레임워크인 D$^3$-Subsidy를 제안합니다. 이 모델은 확률적 충격 대응, 보조금 비율 상한선 준수, 저지연 실행이라는 세 가지 제약 조건을 동시에 해결하며, 접두사 조건부 확산 모델을 통해 미래 궤적을 예측하고 도시 수준의 제어 신호로 변환합니다. 실제 A/B 테스트 결과, 예산 제약을 준수하면서도 운행 건수(Rides)와 총 거래액(GMV)을 유의미하게 개선하는 성과를 거두었습니다.
능동적 문맥 선택을 통한 문맥적 밴딧(Contextual Bandits)의 단순 후회(Simple Regret) 개선
본 연구는 유한한 문맥 공간을 가진 문맥적 다중 팔 밴딧(Contextual Multi-Armed Bandit) 문제에서 능동적 문맥 선택을 통해 단순 후회(Simple Regret)를 개선하는 방법을 다룹니다. 수동적 샘플링 대비 능동적 샘플링이 더 타이트한 후회율을 달성함을 이론적으로 규명하였으며, 문맥 분포를 모르는 상황에서도 최적의 성능을 내는 EETC 알고리즘을 제안합니다.
안정적인 무작위 선택을 위한 매끄러운 부분 복권 (Smooth Partial Lotteries)
기존의 부분 복권(Partial Lotteries) 방식은 후보자의 점수가 미세하게 변할 때 선택 확률이 급격히 변하는 불안정성 문제를 가지고 있습니다. 본 논문은 점수와 선택 확률 사이의 매핑에 Lipschitz 조건을 적용한 '매끄러움(Smoothness)' 개념을 제안하며, 이를 구현하기 위한 Clipped Linear Lottery 메커니즘을 소개합니다.
최적의 표현 크기: 사전 학습(Pretraining) 및 선형 프로빙(Linear Probing)에 대한 고차원 분석
본 연구는 사전 학습(Pretraining)과 선형 프로빙(Linear Probing) 과정에서 표현 차원(Representation dimensionality)이 일반화 성능에 미치는 영향을 고차원 분석 모델을 통해 규명합니다. 연구 결과, 다운스트림 데이터의 양에 따라 최적의 표현 크기가 달라지며, 사전 학습 데이터와 지도 학습 데이터 사이의 정량적인 트레이드오프 관계를 제시합니다.
Heavy-Tailed Flow Matching을 위한 Tail Annealing
표준 생성 모델이 헤비 테일(heavy-tailed) 데이터를 처리할 때 발생하는 한계를 극복하기 위해 'Tail Annealing' 기법을 제안합니다. 데이터에 소프트 로그 변환을 적용하여 멱법칙 꼬리를 지수 분포로 매핑함으로써, 아키텍처 수정 없이도 Flow Matching이 헤비 테일 데이터를 효과적으로 생성할 수 있도록 합니다.
조합 최적화(Combinatorial Optimization)를 위한 알고리즘 정렬(Algorithmic Alignment) 하에서의
본 연구는 조합 최적화(Combinatorial Optimization) 작업에서 지식 증류(Distillation)가 성공하기 위한 조건을 알고리즘 정렬(Algorithmic Alignment) 관점에서 분석합니다. 특히 타겟 모델인 그래프 신경망(GNN)의 아키텍처가 해당 문제의 동적 계획법(DP) 알고리즘과 정렬될 때, 증류가 효율적으로 이루어질 수 있음을 이론적으로 입증합니다.
베이지안 최적화(Bayesian Optimization)를 위한 가우시안 프로세스(Gaussian Processes)의 목표 지향적 하위 꼬리
본 논문은 베이지안 최적화(BO)에서 가우시안 프로세스(GP)의 예측 분포가 하위 꼬리(lower-tail) 영역에서 발생하는 교정 오류를 해결하기 위한 연구를 다룹니다. 연구진은 특정 임계값 $t$ 미만의 예측 신뢰성을 확보하기 위한 새로운 프레임워크를 제안하며, 이를 통해 탐색-활용 트레이드오프를 개선합니다. 제안된 사후 처리 방법인 tcGP는 기존 GP 모델보다 향상된 하위 꼬리 교정 성능과 전역 최적화 성능을 보여줍니다.
Wasserstein 거리 추정을 위한 계산-통계적 실행 시간 최적화
본 논문은 확률 분포 간의 불일치를 측정하는 Squared Wasserstein 거리 계산의 비효율적인 실행 시간을 개선하기 위한 새로운 알고리즘을 제안합니다. 'Sample-Sketch-Solve' 패러다임을 통해 데이터를 압축하고 구조를 정규화함으로써, 특히 저차원 유클리드 공간에서 기존보다 훨씬 빠른 속도로 $\epsilon$-가산 오차 이내의 근사치를 계산할 수 있음을 증명했습니다.
FiLark: 분산 음향 센싱(DAS)에서의 엔드 투 엔드 탐색, 주석 달기 및 알고리즘 통합을 위한 스트리밍 우선 소프트웨어 프레임워크
FiLark는 분산 음향 센싱(DAS)의 방대한 데이터 스트림을 효율적으로 처리하기 위해 설계된 스트리밍 우선 Python 프레임워크입니다. 이 프레임워크는 데이터 탐색, 실시간 주석 달기, 신호 처리 및 알고리즘 모니터링을 하나의 통합된 워크플로로 제공하여 오프라인 처리의 한계를 극복합니다.
항공우주용 SiC/SiC 복합재의 X-ray 단층 촬영 결함 탐지를 위한 해석 가능한 컴퓨터 비전
항공우주용 SiC/SiC 복합재의 X-ray 단층 촬영(XCT) 결함 탐지를 위해 높은 정확도와 해석 가능성을 동시에 제공하는 p-ResNet-50 프레임워크를 제안합니다. 이 모델은 전문가가 정의한 의미론적 범주를 기반으로 한 프로토타입 레이어를 사용하여 블랙박스 문제를 해결하고, 결정 근거를 물리적으로 의미 있는 참조값으로 제시합니다. 이를 통해 산업 현장에서 요구되는 투명성과 추적 가능한 비파괴 검사 워크플로우를 구축할 수 있습니다.
구조화된 상호작용 학습(Structured Interactive Learning)에서 모델 붕괴(Model Collapse)는 언제 발생하는가?
본 연구는 다중 모델이 합성 데이터를 주고받으며 학습하는 구조화된 상호작용 학습 환경에서 발생하는 모델 붕괴(Model Collapse) 현상을 분석합니다. 모델 간의 상호작용을 유향 그래프로 공식화하여, 모델 붕괴의 발생 여부가 상호작용 그래프의 위상(Topology)에 결정적으로 의존함을 증명했습니다. 또한 모델 붕괴가 발생하는 시점을 정의하는 필요충분조건을 도출하고 이론적·수치적 검증을 완료했습니다.
TrajTok: 궤적 표현 학습을 위한 적응형 공간 토큰화 (Adaptive Spatial Tokenization)
TrajTok은 노이즈가 많고 불규칙한 GPS 데이터를 효과적으로 처리하기 위해 다중 해상도 육각형 셀 분할을 사용하는 적응형 공간 토큰화 기술입니다. 인수분해된 트랜스포머 인코더와 ST-RoPE를 통해 기하학적 구조와 운동학적 패턴을 동시에 학습하며, 마스크 토큰 모델링 방식으로 사전 학습됩니다. 실험 결과, 동결된 인코더만으로도 궤적 검색, 분류, ETA 예측 등 다양한 태스크에서 기존 방법론을 능가하는 범용성을 입증했습니다.
SAGE: 사기 탐지에서 신뢰할 수 있는 부정 사례 수집을 위한 확장 가능한 자동 게이팅 앙상블
음악 스트리밍 사기 탐지 시 정당한 사용자 패턴과 사기 패턴을 구분하기 어려운 문제를 해결하기 위해 SAGE 프레임워크를 제안합니다. SimHash 기반의 층화 추출과 모듈형 게이팅 앙상블을 결합하여 라벨이 없는 데이터로부터 신뢰할 수 있는 부정 사례를 자동으로 수집합니다. 이를 통해 Positive-Unlabeled 학습 시 발생하는 표현 편향을 줄이고 높은 정밀도와 재현율을 달성했습니다.
이미지 조작 국지화에 대한 다축 분석
생성형 AI의 발전으로 정교한 이미지 조작이 쉬워짐에 따라, 다양한 시각적 도메인에서 조작을 탐지하기 위한 새로운 벤치마크인 AUDITS를 제안합니다. AUDITS는 사용자 및 뉴스 사진 53만 개 이상의 데이터를 포함하며, 확산 기반 인페인팅 기술을 활용해 조작 유형, 크기, 품질, 도메인 변화를 다각도로 분석합니다. 이를 통해 기존 탐지 모델의 강건성을 평가하고 더욱 신뢰할 수 있는 탐지 기술 개발을 목표로 합니다.
사전 지식인가 탐색인가? 하드웨어 인지적 코드 최적화에서의 LLM 에이전트에 관한 연구
본 연구는 LLM 에이전트가 하드웨어 인지적 코드 최적화 과정에서 피드백을 활용하는지, 아니면 사전 학습된 지식에 의존하는지를 분석합니다. 실험 결과, LLM은 제공된 피드백이나 특정 지침보다 사전 학습된 데이터(priors)에 크게 의존하며, 특히 저밀도 언어 환경에서는 최적화 성능이 급격히 저하되는 경향을 보였습니다.
의료 영상 분류의 공정성을 위한 뉴런 발생 분포 재배치 (Neuron Incidence Redistribution)
의료 영상 분류 모델이 특정 인구통계학적 그룹에 대해 과잉 또는 과소 진단을 내리는 편향 문제를 해결하기 위한 새로운 정규화 방법인 NIR(Neuron Incidence Redistribution)을 제안합니다. NIR은 인구통계학적 레이블 없이도 마지막 전 층 뉴런의 활성화 분포를 재배치하여 질병 증거를 분산시킴으로써 그룹 간 성능 격차를 획기적으로 줄입니다.
TIDE: 안정화된 시간적 억제-흥분 역학을 위한 비대칭 신경 회로
TIDE는 연속적 사고 기계(CTM)의 불안정성을 해결하기 위해 비대칭 흥분-억제(E-I) 네트워크를 활용한 새로운 신경 모사 아키텍처입니다. Wilson-Cowan 역학 및 측면 억제를 통합하여 안정적인 신경 역학을 구현하며, 생물학적 실재감과 엔드투엔드 학습 능력을 동시에 확보했습니다. 실험 결과, 기존 CTM 대비 훈련 시간을 50% 이상 단축하면서도 ImageNet 정확도를 향상시키는 성능을 입증했습니다.
이 피드 구독하기
본 페이지의 콘텐츠는 AI가 공개된 소스를 기반으로 자동 수집·요약·번역한 것입니다. 원 저작권은 각 원저작자에게 있으며, 각 게시물의 “원문 바로가기” 링크를 통해 원문을 확인할 수 있습니다. 저작권자의 삭제 요청이 있을 경우 신속히 조치합니다.