Insights

AI가 자동으로 큐레이션·번역·정리하는 기술 동향 피드입니다.

SOC-ICNN: 선형 계획법에서 이차원뿔 기하학으로 볼록 근사 함수 학습

본 논문은 기존의 ReLU 기반 입력 볼록 신경망(ICNN)이 선형 계획법(LP)에 국한되어 표현력에 한계가 있다는 점을 지적하고, 이를 극복하기 위해 이차원뿔 계획법(SOCP)으로 일반화된 아키텍처인 SOC-ICNN을 제안합니다. SOC-ICNN은 원뿔 기본 요소를 도입하여 함수 근사에 매끄러운 곡률을 추가하면서도 엄밀한 최적화 이론적 해석을 유지하며, 기존 ICNN보다 표현 공간을 확장시키면서도 계산 복잡도를 증가시키지 않음을 증명했습니다.

4월 27일6

arXiv논문

분포 외 탐지 및 일반화를 위한 신경 활성화 커버리지 재검토

본 기사는 분포 외 탐지(OOD detection) 및 일반화에 사용되는 신경 활성화 커버리지(NAC)라는 기술을 다루고 있습니다. 연구진은 이 NAC 기반의 접근 방식을 회귀 도메인에서 불확실성 추정 기술로 확장했으며, 그 결과를 통해 NAC가 몬테카를로 드롭아웃과 같은 기존 방법론보다 더 신뢰할 수 있는 불확실성 점수를 제공함을 입증했습니다.

4월 27일5

arXiv논문

핵심 요소만 선택: 커널 릿지 회귀를 위한 적응형 사전 학습 (Adaptive Dictionary Learning)

본 기술 기사는 커널 릿지 회귀(KRR)의 주요 문제점인 $O(n^2)$의 메모리 요구 사항을 해결하는 방법을 다룹니다. 기존의 Nystrom 근사법은 샘플링 방식에 따라 정확도와 공간 복잡도 사이에서 트레이드오프가 존재합니다. 본 논문에서는 INK-Estimate 알고리즘을 기반으로, 정규화되지 않은 릿지 레버리지 점수(unnormalized RLS)를 사용하는 새로운 방법인 SQUEAK을 제안합니다. 이 SQUEAK 알고리즘은 구현이 간결하고 유효 차원 추정 과정 없이도 기존의 정확한 샘플링 방식과 유사한 공간 복잡도를 달성할 수 있습니다.

4월 27일6

arXiv논문

유연한 거부 샘플링 (Pliable Rejection Sampling)

본 논문은 어려운 분포에서 효율적으로 샘플을 추출하기 위한 새로운 기법인 유연한 거부 샘플링(Pliable Rejection Sampling, PRS)을 제안한다. 기존 거부 샘플링의 높은 거부율 문제를 해결하고, 커널 추정자를 사용하여 샘플링 제안을 학습하는 것이 특징이다. 이 방법은 얻어진 샘플들이 i.i.d.이며 특정 분포를 따르고, 수용된 샘플 개수에 대한 성능 보장까지 제공한다.

4월 27일8

arXiv논문

Conformalized Super Learner

본 논문은 Super Learner(SL)와 Conformal Prediction(CP) 프레임워크를 결합하여 예측 성능과 유효한 구간 커버리지를 모두 확보하는 방법을 제안합니다. 기존 SL 기반 구간 예측 방법들이 점근적 가정이나 계산 집약적인 절차에 의존했던 한계를 극복하고, 개별 학습기 가중치를 사용하여 자연스럽게 CP와 SL을 결합했습니다. 이 접근법은 교환 가능성 위반, 이분산성, 희소성 등 복잡한 데이터 분포의 다양한 형태에서 경쟁력 있는 성능과 유효한 유한 표본 커버리지를 입증합니다.

4월 27일8

arXiv논문

힌지 손실과 L1 노름의 혼합 거리를 활용한 강건한 퍼지 로컬 k-평면 클러스터링

본 논문은 기존 K-평면 클러스터링(KPC) 모델이 L2 거리를 가정하여 이상치에 취약하다는 문제를 해결하기 위해 새로운 강건한 퍼지 로컬 k-평면 클러스터링(RFLkPC) 방법을 제안합니다. RFLkPC는 힌지 손실과 L1 노름의 혼합 거리를 결합하고, 각 평면 클러스터가 유한 영역에 제한된다고 가정하여 강건성을 높였습니다. 이 방법은 이상치 처리와 성능 면에서 기존 모델들보다 우수함을 실험적으로 입증했습니다.

4월 27일6

arXiv논문

그래프 트랜스포머에서의 거리 불일치 학습과 적응형 그래프 인식 제어

본 논문은 그래프 트랜스포머가 직면하는 '거리 불일치' 문제를 다루며, 이는 작업의 특성(지역적 상호작용 vs. 장거리 통신)에 따라 모델이 필요로 하는 정보 전달 거리가 달라지기 때문에 발생합니다. 연구진은 합성 노드 분류 벤치마크를 통해 거리 불일치를 정의하고, 오라클 적응형 컨트롤러가 작업 측의 거리 목표에 접근할 때 가장 우수한 성능을 보임을 입증했습니다. 이는 그래프 인식 제어(graph-aware control) 설계 시 단순히 모델 구조만 조정하는 것이 아니라, 작업 특성에 맞는 '제어 목표'를 명시적으로 설정하는 것이 중요함을 보여줍니다.

4월 27일6

arXiv논문

From Local to Cluster: A Unified Framework for Causal Discovery with Latent Variables

본 논문은 잠재 변수가 존재하는 환경에서 지역적(local) 구조 학습의 한계와 클러스터 수준 분석의 제약을 극복하는 통합 프레임워크인 L2C (Local to Cluster Causal Abstraction)를 제안합니다. L2C는 지역적 인과 패턴을 자동으로 파티션하고, 클러스터 축소 정리를 활용하여 인과 정보 손실 없이 노드를 축소합니다. 이를 통해 잠재 변수 환경에서도 인과 충분성을 가정하지 않고 미시적 및 거시적 수준의 인과 관계를 모두 포착하는 통합적인 접근 방식을 제공합니다.

4월 27일7

arXiv논문

Manifold-Aware Expert Evolution 을 통한 적응형 연속 모델 병합으로

본 논문은 기존 연속 모델 병합(CMM)의 한계점인 파라미터 포화 및 표현 간섭 문제를 해결하기 위해 MADE-IT라는 적응형 CMM 방법을 제안합니다. MADE-IT는 다양체 기하학을 기반으로 전문가 관리와 활성화를 조율하며, 분포 인식적 임계값 메커니즘과 서브스페이스 친밀도 계량을 활용하여 자율적인 전문가 진화를 유도합니다. 또한 데이터 및 학습 과정 없이 특징-서브스페이스 정렬을 통해 전문가를 활성화하는 효율적인 라우팅 메커니즘을 제시함으로써, 장기 시퀀스 작업에서 높은 정확도와 견고성을 입증했습니다.

4월 27일7

arXiv논문

모든 시선이 워크플로우로: 비디오 스트림으로부터 자동화되고 효율적인 이벤트 발견

본 연구는 비디오 스트림과 같은 다중 모달리티 데이터에서 이벤트 데이터를 자동으로 추출하고 효율적으로 처리하는 'SnapLog'라는 접근법을 제안합니다. 이 방법은 이미지 임베딩을 사용하여 비디오 프레임을 특징 벡터로 변환하고, 시간적 유사도 분석을 통해 비디오를 세그먼트로 분할하여 이벤트 데이터를 생성합니다. 이렇게 추출된 구조화된 로그는 기존의 프로세스 마이닝 기법으로 활용되어 비즈니스 프로세스에 대한 깊은 통찰력을 제공할 수 있습니다.

4월 27일6

arXiv논문

FedSPDnet: Stiefel 제약 조건을 가진 대칭 양의 정부호 (SPD) 행렬에서 작동하는 고전적 SPDnet 모델에 대한 기하구조 인식 연방 딥러닝

FedSPDnet은 Stiefel 제약 조건을 가진 대칭 양의 정부호(SPD) 행렬에 작동하는 고전적 SPDnet 모델을 위한 두 가지 연방 학습 프레임워크를 제시합니다. 이 접근 방식은 표준 유클리드 평균화 대신 ProjAvg와 RLAvg라는 기하구조 보존 집계 전략을 사용하여 직교성을 유지하며, 계산 효율성과 옵티마이저 독립성을 확보했습니다. 시뮬레이션 결과, FedSPDnet은 EEG 운동 상상 벤치마크에서 기존의 연방 모델보다 우수한 성능과 견고성을 보여주었습니다.

4월 27일3

arXiv논문

이타콘산 생산 시뮬레이션을 위한 모델 보정 딥러닝

본 연구는 실제 배치 실험 데이터를 활용하여 이타콘산(itaconic acid) 생산을 위한 속도론적 파라미터를 추정하는 모델링에 딥러닝을 적용했습니다. 특히, 직접 딥러닝(DDL)과 생성형 조건부 흐름 매칭(CFM) 두 가지 전략을 비교한 결과, CFM이 비선형 회귀 기반의 벤치마크보다 더 높은 정확도와 일관성을 보였습니다. 이러한 결과는 CFM이 다양한 운전 조건 및 규모 확대 과정에서도 우수한 일반화 성능과 견고성을 제공함을 입증했습니다.

4월 27일6

arXiv논문

설명 가능하고 공정하며 관찰 가능한 병원 재입원 예측을 위한 통합 프레임워크: MIMIC-IV 데이터베이스를 통한 개발 및 검증

본 논문은 병원 재입원 예측 모델의 임상적 적용을 가로막는 설명 가능성, 배포 신뢰성, 공정성 문제를 해결하기 위한 통합 프레임워크를 제안합니다. MIMIC-IV 데이터베이스를 사용하여 훈련된 이 프레임워크는 XGBoost와 LightGBM 같은 고급 머신러닝 모델을 활용하여 높은 예측 성능(AUC-ROC 0.696)을 달성했습니다. 특히 SHAP 값을 이용한 환자별 설명과 다양한 하위 그룹에 대한 공정성 평가를 통해 임상 현장에서 신뢰할 수 있는 솔루션을 제공함을 입증했습니다.

4월 27일5

arXiv논문

자연 도메인 기반 모델이 가속화된 심장 MRI 재구성 가속화에 효과적인가?

본 연구는 자연 도메인 기반의 대규모 기초 모델(foundation model)이 가속화된 심장 MRI 재구성에 효과적인 이미지 사전으로 사용될 수 있는지 탐구합니다. 제안된 언롤드 재구성 프레임워크는 CLIP, DINOv2 등 다양한 고정 시각 인코더를 통합하여 재구성 과정을 안내하며, 표준 분포 및 도전적인 교차 도메인 시나리오에서 성능을 평가했습니다. 실험 결과, 기초 모델 기반 접근법은 특히 높은 가속화 인자 및 제한된 샘플링 조건 하에서 뛰어난 견고성과 일반화 능력을 보여주었으며, 이는 전이 가능한 구조적 표현의 유망한 출처임을 입증합니다.

4월 27일8

arXiv논문

복잡한 항공기 생산 시스템용 다변수 극단 공간 모델

본 논문은 복잡한 항공기 생산 시스템과 같은 다변수 환경에서 발생하는 비정상적이고 극단적인 사건(extreme events)을 분석하기 위한 '다변수 극단 공간 모델'을 제안합니다. 기존의 머신러닝 모델이 평균 패턴에 집중하는 한계를 넘어, 무거운 꼬리를 가진 분포에서 발생하는 복잡한 극단 위험을 포착할 수 있습니다. 이 모델은 두 개의 공간 영역에서의 쌍선형 함수를 사용하여 동역학을 효율적으로 모델링하며, 그래프 보조 합성 가능도 추정 기법과 결합하여 높은 예측 성능을 입증했습니다.

4월 27일7

arXiv논문

악성코드와 탐지 모델의 적대적 공진화: 이계수준 최적화 관점

본 논문은 기계 학습 기반 악성코드 탐지기가 적응형 공격자에게 취약한 문제를 다루며, 방어자와 공격자의 전략적 상호작용을 모델링하기 위해 이계수준 최적화(bilevel optimization) 기반의 견고한 방어 프레임워크를 제안합니다. MAB-malware 프레임워크로 세 가지 악성코드 계열에 대한 실험 결과, 기존 방법들이 높은 우회율을 보이는 반면, 제안된 이계수준 최적화 접근법은 거의 완전한 면역성을 달성하여 탐지 시스템의 탄력성을 크게 향상시켰습니다. 이는 적대적 위협에 대응하기 위해 공격과 방어의 반복 주기를 모델링하는 것이 필수적임을 시사합니다.

4월 27일4

arXiv논문

의생명 이미지에 유용한 비강인성 특징이 널리 존재한다

본 연구는 의료 이미지 분석을 위한 딥러닝 모델이 인간에게 해석 불가능하고 적대적 교란에 취약한 '유용한 비강인성 특징'을 학습하는지, 그리고 이것이 실제 성능에 미치는 영향을 조사했습니다. 오직 이러한 비강인성 특징만을 사용해 훈련된 모델은 표준 데이터 분포 내(in-distribution)에서 높은 정확도를 보였으나, 적대적으로 훈련되어 강인성에 초점을 맞춘 모델들은 분포 외(out-of-distribution) 환경에서 훨씬 우수한 성능을 나타냈습니다. 결론적으로, 의생명 영상 분류 작업에서는 실용적인 강인성-정확도 트레이드오프를 고려하여 모델을 조정해야 함을 시사합니다.

4월 27일8

arXiv논문

WassersteinGrad 를 활용한 동적 물리장 예측 설명: 자기회귀 기상 예보에의 적용

본 논문은 기상 예측과 같은 동적 물리장(dynamic physical fields)의 자기회귀 신경망 예측을 설명하는 새로운 방법인 WassersteinGrad를 제안합니다. 기존의 점별 평균 기반 귀속 맵 집계 전략이 공간적으로 정렬되지 않은 특징에 취약하여 '기하학적 이동' 문제를 일으키는 것을 해결하기 위해, WassersteinGrad는 엔트로피 Wasserstein 바리센터를 사용하여 교란된 귀속 맵들의 기하학적 합의(geometric consensus)를 추출합니다. 이 방법은 단일 단계 및 자기회귀 예보 설정 모두에서 기존 경계 기반 방법보다 우수한 설명 가능성을 보여주었습니다.

4월 27일5

arXiv논문

효율적인 멀티헤드 어텐션 을 위한 적응형 헤드 예산 할당

본 논문은 표준 다중 헤드 어텐션(Multi-Head Attention)이 모든 입력에 대해 균일하게 작동하여 불필요한 계산 비용을 발생시키는 문제를 해결하고자 합니다. 이를 위해 'BudgetFormer'라는 적응형 메커니즘을 제안하며, 이 모델은 각 입력에 필요한 주의 헤드의 수('헤드 예산')와 가장 정보량이 많은 헤드를 선택하는 '관련성 분포'를 동적으로 학습합니다. 실험 결과, BudgetFormer는 표준 어텐션 대비 FLOPs 및 메모리 사용량을 크게 줄이면서도 텍스트 분류 등 다양한 작업에서 우수한 성능을 입증했습니다.

4월 27일5

arXiv논문

환자 불변성을 넘어: 행동 조건부 JEPAs 를 통한 심장 동역학 학습

본 논문은 의료 분야의 자기지도학습(SSL)이 기존에 사용해 온 환자 불변성 기반 목표가 정적인 해부학적 특징 학습에만 국한되어 임상 진단과 괴리가 있음을 지적하며, 이를 극복하기 위해 행동 조건부 월드 모델(Action-Conditioned World Models)을 제안합니다. 이 프레임워크는 질병 진행의 동역학을 시뮬레이션하거나 사건 조건부 학습을 가능하게 하여, 병리학을 정적 레이블이 아닌 환자의 잠재 상태에 작용하는 전이 벡터로 정의합니다. MIMIC-IV-ECG 데이터셋에서 테스트한 결과, 이 접근법은 중요한 선별 작업에서 완전 지도학습 기반선보다 우수한 성능과 높은 샘플 효율성을 보여주었습니다.

4월 27일5

이 피드 구독하기

RSSFeedly, Inoreader 등으로 구독

API/api/search?q=검색어

AIllms.txt로 AI 크롤링 가이드