Insights
AI가 자동으로 큐레이션·번역·정리하는 기술 동향 피드입니다.
arXiv cs.LG 1862건필터 해제
KANLib -- 모듈식, 확장 가능하며 빠른 Kolmogorov-Arnold Network 구현체
KANLib은 Kolmogorov-Arnold Networks(KANs)를 효율적으로 연구하기 위한 모듈식 프레임워크입니다. 기존 KAN 구현체들의 핵심 개념을 통합하여 높은 계산 효율성과 유연한 아키텍처 커스터마이징을 제공합니다.
SoftMoE: LLM을 위한 Mixture-of-Experts의 소프트 미분 가능 라우팅 (Soft Differentiable Routing)
SoftMoE는 기존 MoE의 미분 불가능한 이산적 top-k 라우팅 문제를 해결하기 위해 소프트 미분 가능 라우팅 방식을 제안합니다. 이를 통해 레이어별 전문가 할당을 최적화하며, 적은 전문가 활성화로도 기존 희소 MoE와 대등하거나 뛰어난 성능을 보여줍니다.
XGBoost 모델과 하이브리드 Ret-DNN을 이용한 고객 행동 예측용 이커머스 예측 분석
이커머스 고객의 구매 행동을 예측하기 위해 XGBoost와 하이브리드 Ret-DNN을 결합한 새로운 모델을 제안합니다. 정형 데이터와 시간적 특징을 동시에 포착하여 기존 Ret-DNN 모델보다 향상된 예측 성능을 입증했습니다.
시각적 단서를 넘어: 반지도 학습 기반 의료 영상 분할을 위한 CoT 강화 추론
반지도 학습 기반 의료 영상 분할의 한계를 극복하기 위해 사고의 사슬(CoT) 추론을 통합한 CERS 프레임워크를 제안합니다. LLM의 언어적 추론을 활용하여 시각적 유사성만으로는 구분하기 어려운 병리학적 차이를 식별하고 정확도를 높였습니다.
가우시안 프로세스 사후 샘플링의 차분 프라이버시 (Differential Privacy)
가우시안 프로세스(GP)의 사후 샘플 경로를 공개할 때 발생하는 프라이버시 문제를 Rényi-DP 경계를 통해 분석한 연구입니다. 사후 샘플링의 내재적 무작위성이 제공하는 차분 프라이버시 보장 범위를 도출하고, 규제와 유용성 사이의 관계를 규명합니다.
장기 시계열 예측을 위한 다중 주기성 및 채널 상관관계를 이용한 웨이브렛 분해 (Multiple cyclicity and Wavelet
장기 시계열 예측을 위해 주기성, 추세, 채널 간 상관관계를 별도로 모델링하는 McWC 모델을 제안합니다. 웨이브렛 분해를 통해 고주파 및 저주파 정보를 모델링하며, 기존 모델 대비 높은 계산 효율성과 최첨단 성능을 입증했습니다.
절반의 링크만으로도 전체 링크를 예측할 수 있다: 지식 그래프 파운데이션 모델(Knowledge Graph Foundation Models)의
지식 그래프 파운데이션 모델(KGFM)의 제로샷 일반화 메커니즘을 분석한 연구입니다. '하프 링크' 개념을 도입하여 부분적인 정보만으로도 링크 예측이 가능함을 증명하고, 모델의 일반화 성능을 진단할 수 있는 새로운 분류 체계를 제안합니다.
C2FL: 공간적 및 시간적 드리프트(Drift) 환경에서의 클러스터링 기반 지속적 연합 학습 (Clustered Continual
공간적·시간적 드리프트가 발생하는 환경에서 프라이버시를 보호하며 학습할 수 있는 분산형 연합 학습(C2FL) 프레임워크를 제안합니다. 노드들이 공간적 클러스터링을 통해 스스로 학습 그룹을 조직하고, 경험 재현과 적응형 평균화를 통해 변화하는 데이터 분포에 대응합니다.
2단계 회귀를 통한 빠른 비매개변수 조건부 독립성 검정
BLITZ는 제약 기반 인과 발견을 위해 설계된 빠르고 정확한 비매개변수 조건부 독립성 검정 방법론입니다. 저차 다항 회귀와 얕은 트리 회귀를 결합한 2단계 잔차화 과정을 통해, 계산 속도를 1초 미만으로 단축하면서도 높은 캘리브레이션 정확도를 유지합니다.
미소 너머: 암호화폐 변동성 표면을 위한 하이브리드 합성곱 VAE
암호화폐(BTC, ETH)의 내재 변동성 표면을 예측하기 위해 합성곱 VAE와 이차 미소 재적합을 결합한 하이브리드 모델을 제안합니다. 이 모델은 데이터 결손이 심한 상황에서도 기존 방식보다 훨씬 낮은 오차로 변동성 표면을 완성하며 차익거래 기회 포착에 유리합니다.
실제 로봇의 5구 저글링을 위한 작업 오차 잔차 학습 (Task-Error Residual Learning)
방향성 작업 오차 감독과 작업 오차 모델을 활용한 잔차 학습을 통해 실제 로봇의 5구 저글링을 성공적으로 구현했습니다. 기존 강화학습의 낮은 샘플 효율성을 극복하기 위해 정보가 풍부한 피드백과 분석적 사전 정보를 결합하는 방법론을 제시합니다.
고정 크기 신경망을 이용한 임의 정확도의 Sobolev 근사
고정 크기 신경망을 사용하여 Sobolev 근사를 임의의 정확도로 달성하는 새로운 활성화 함수 연구를 소개합니다. EUAF와 DUAF 제품군을 통해 함수 공간 내에서의 근사 가능성을 증명하고 네트워크의 너비와 깊이 경계를 명시합니다.
확률적 희소화(Probabilistic Thinning)를 통한 저지연 피처 엔진의 추론과 상태 업데이트 분리
스트리밍 머신러닝 파이프라인에서 추론과 상태 업데이트를 분리하여 지연 시간을 줄이는 확률적 희소화(Probabilistic Thinning) 기법을 제안합니다. 모든 이벤트에 대해 점수를 매기되, 정보가 풍부한 이벤트만 선택적으로 상태를 업데이트하여 저장소 I/O 오버헤드를 획기적으로 낮춥니다.
Stochastic Vec Trick을 이용한 확장 가능한 쌍별 커널 학습 (Scalable Pairwise Kernel Learning
본 연구는 쌍별 학습(Pairwise learning)의 계산 및 메모리 효율성을 높이기 위한 새로운 커널 학습 방법론인 SPaiK를 제안합니다. 확률적 일반화 vec trick(sGVT)을 통해 커널의 표현력을 유지하면서도 대규모 데이터셋에 적용 가능한 확장성을 확보했습니다.
이차 다항식에 대한 Min-Max 최적화의 복잡성
하이퍼큐브 상의 이차 다항식에 대한 Min-Max 최적화의 근사 정지점 계산이 PPAD-hard임을 증명한 연구입니다. 이를 통해 2인 팀 제로섬 폴리매트릭스 게임에 대한 최초의 PPAD-hardness 결과를 도출했습니다.
Dynestyx: 동적 시스템을 위한 확률적 프로그래밍 라이브러리
동적 시스템의 베이지안 처리를 위해 상태 공간 모델(SSM)을 일급 객체로 지원하는 확률적 프로그래밍 라이브러리 Dynestyx를 소개합니다. 이 라이브러리는 이산 및 연속 시간 시스템에 대한 통합 인터페이스를 제공하여 상태와 파라미터 추정을 용이하게 합니다.
프로그램으로서의 에이전트 궤적: 지문 식별 및 코딩 에이전트 행동 프로그래밍
에이전트의 행동 습관을 '지문(fingerprints)'으로 정의하여 모델과 작업 간의 절차적 차이를 분석하는 연구를 소개합니다. SWE-Bench를 통해 모델 간 행동 유사성을 검증했으며, 에이전트 궤적을 감사하고 평가하기 위한 라이브러리 ProcGrep을 제안합니다.
비조영 CT를 이용한 복부 질환 진단 및 보고서 생성을 위한 멀티 센터 벤치마크
비조영 CT(NCCT)로부터 조영 증강 소견을 합성하여 복부 질환을 진단하고 보고서를 자동 생성하는 새로운 멀티 센터 벤치마크를 제안합니다. 대규모 데이터셋과 5가지 딥러닝 아키텍처 벤치마킹을 통해 NCCT의 진단 가능성을 입증했습니다.
해석적 비틀림(Analytic Torsion)과 스펙트럼 간극(Spectral Gap)을 통한 지속적
지속적 라플라시안의 고차원성과 가변 길이 문제를 해결하기 위해 베티 수, 스펙트럼 간극, 해석적 비틀림을 활용한 압축된 스펙트럼 표현을 제안합니다. 벤치마크 실험을 통해 계산 효율성을 높이면서도 필수적인 예측 신호를 효과적으로 포착함을 입증했습니다.
의심스러울 때는 계획을 세워라: 반응형 강화학습 (Reactive Reinforcement Learning)을 위한 전념형 소형 언어 모델
반응형 강화학습(RL)의 한계를 극복하기 위해 SLM 플래너를 결합한 하이브리드 아키텍처 PACT를 제안합니다. PACT는 비동기적으로 계획을 생성하고 검증하여 RL 정책을 우회함으로써 미지의 환경에서도 안정적인 성능을 보여줍니다.
이 피드 구독하기
본 페이지의 콘텐츠는 AI가 공개된 소스를 기반으로 자동 수집·요약·번역한 것입니다. 원 저작권은 각 원저작자에게 있으며, 각 게시물의 “원문 바로가기” 링크를 통해 원문을 확인할 수 있습니다. 저작권자의 삭제 요청이 있을 경우 신속히 조치합니다.