Insights
AI가 자동으로 큐레이션·번역·정리하는 기술 동향 피드입니다.
arXiv cs.LG 271건필터 해제
제약된 볼록 영역에 대한 로그우도 확률 분포로부터 표본 추출을 위한 분산형 근접 확률적 경사 랜지민 역학 (DE-PSGLD)
이 논문은 로그우도 확률 분포를 제한된 볼록 영역으로 국한하여 표본 추출하기 위한 새로운 분산형 마르코프 체인 몬테 카를로(MCMC) 알고리즘인 DE-PSGLD를 제안합니다. 이 방법은 Moreau-Yosida envelope 기반의 공유 근접 정규화를 사용하여, 제약 조건 하에서도 업데이트 과정의 일관성을 유지하면서도 비제약적인 계산을 가능하게 합니다. 연구진은 2-Wasserstein 거리에서 수렴을 보장하고, 실제 및 합성 데이터셋에서 높은 성능과 빠른 후방 집중 능력을 입증했습니다.
EASE: 엔탱글먼트 인식 공간 절개를 통한 연방 다중 모달 학습 비학습
EASE(Entanglement-Aware Subspace Excision)는 연방 다중 모달 학습(FML) 환경에서 발생하는 '잊혀진 지식'의 엉킴 문제를 해결하기 위해 제안된 프레임워크입니다. 이 방법은 세 가지 핵심 앵커(쌍선형 결합, 주성분 각도 서브스페이스 엔탱글먼트, 지속적 연방 업데이트 잔류)를 식별하고, 이를 체계적으로 절개(Excision)하여 모델의 비학습(Continual Learning) 성능을 향상시킵니다. EASE는 모달리티 간 재구성 채널 차단, 서브스페이스 엔탱글먼트 해결, 그리고 방향 선택적 Forget Lock 기능을 통합하여 효과적인 연방 비학습 솔루션을 제공합니다.
예측 불가능한 병원 재입원 예측을 위한 시간적 데이터 요구사항
본 연구는 골절 및 무릎 인플란트 후 30일 재입원 예측에 필요한 최적의 역사적 데이터 시간 창을 결정하는 것을 목표로 합니다. 다양한 관찰 기간(수술 전 최대 3년)과 여러 임베딩 기법(BOW, TF-IDF부터 BERT, BiLSTM 등)을 사용하여 구조화된 EHR 기록과 비구조화된 임상 노트를 결합한 모델의 성능을 평가했습니다. 그 결과, 비구조화된 임상 노트는 수술 전 3~6개월의 비교적 짧은 시간 창에서 최대 예측 성능을 보인 반면, 구조화된 데이터는 시간이 지남에 따라 성능이 점진적으로 개선되었으나 특정 시점 이후에는 포화되는 경향을 보여, 모달리티별로 최적의 데이터 사용 전략이 다름을 입증했습니다.
랜덤화된 서브스페이스 네스테로프 가속화 경사 하강법
본 논문은 랜덤화된 서브스페이스(Randomized-subspace) 정보만을 활용하여 일차 최적화 비용을 줄이는 새로운 네스테로프 가속화 경사 하강법을 개발했습니다. 이 방법은 특히 통신이 제한적이거나 포워드 모드 자동 미분이 필요한 환경에서 효율적입니다. 연구진은 행렬 매끄러움과 일반적인 스키치 모멘트 가정을 기반으로, 전체 차원 네스테로프 방법을 복원하는 세 가지 시퀀스 형성 기술을 도입하여 이론적으로 가속화된 오라클 복잡도 보장을 확립했습니다.
양자 신경망의 인증된 학습을 위한 양자 구간 경계 전파
본 논문은 양자 머신러닝 모델의 인증된 학습을 위해 '양자 구간 경계 전파(QIBP)'를 제안합니다. QIBP는 고전적인 인증 학습 방법인 IBP를 양자 도메인에 적용하여, 훈련 과정에서 적대적 섭동이 발생하더라도 모델이 올바른 라벨 예측을 보장하는 강력한 결정 경계를 확립합니다. 연구진은 이 방법을 구간 산술과 선형 산술 두 가지 방식으로 구현하고 평가하여 그 효과를 입증했습니다.
NonZero: 상호작용 기반 탐색을 통한 다중 에이전트 몬테카를로 트리 검색
NonZero는 상호작용 기반 제안 규칙(interaction-guided proposal rule)을 도입하여 다중 에이전트 몬테카를로 트리 검색(MCTS)의 확장성을 크게 향상시킨 방법론입니다. 기존 MCTS가 연립 행동 공간의 지수적 증가 문제에 직면했던 것과 달리, NonZero는 상호작용 점수를 활용하여 계산 가능한 방식으로 다중 에이전트 탐색을 수행합니다. 이 접근 방식은 로컬 편차를 밴디트 문제로 공식화하고 근사 그래프-로컬 최적점에 도달하는 보장된 규칙을 제공함으로써 높은 샘플 효율성과 성능 개선을 입증했습니다.
Themis: 다국어 코드 보상 모델의 강건한 훈련을 위한 유연한 다중 기준 점수화
본 논문은 언어 모델(LM)의 후처리 과정에서 필수적인 요소인 보상 모델(RM)을 활용하여 코드 생성 능력을 향상시키는 방법을 제시합니다. 기존 연구가 실행 피드백에 국한된 한계를 가졌던 것과 달리, 본 연구는 다국어 및 다중 기준 평가를 위한 새로운 벤치마크(Themis-CodeRewardBench)와 대규모 선호 쌍 데이터셋(Themis-CodePreference)을 개발했습니다. 이를 통해 다양한 기준(5개 차원)에 걸쳐 강건하게 훈련된 다국어 코드 보상 모델인 Themis-RM을 구축하고, 그 성능과 중요성을 입증합니다.
DeepONet 기반 물리 정보 신경 연산자 네트워크를 활용한 비매개변수 2D 헬름홀츠 방정식 해법
본 논문은 DeepONet 기반의 물리 정보 신경 연산자 네트워크를 사용하여 임의 경계 기하학을 갖는 도메인에서의 2D 헬름홀츠 방정식을 비매개변수 방식으로 해결하는 방법을 제시합니다. 이 접근법은 포함물의 부호 거리 함수와 로컬 정보를 인코딩하여 DeepONet의 브랜치 및 트렁크 부분에 입력으로 사용하며, 이를 통해 임의 기하학을 가진 도메인에서도 일반화된 해를 얻을 수 있습니다. 결과적으로, 기존 유한 요소 방법(FEM) 대비 계산 효율성이 높고, 새로운 영역에 대한 재훈련 없이도 확장 가능한 강력한 대리 모델(surrogate model)을 제공합니다.
SAVGO: 연속 제어에서 코사인 유사성을 활용한 상태-행동 가치 기하학 학습
SAVGO는 강화학습(RL)의 샘플 효율성을 높이기 위해 상태-행동 가치 기하학을 활용하는 새로운 알고리즘입니다. 이 방법은 유사한 행동-가치 추정을 가진 쌍이 높은 코사인 유사도를 갖도록 임베딩 공간을 학습하며, 이를 통해 정책 업데이트를 지역적 기울기 기반 방식에서 벗어나 더 넓고 높은 가치의 영역으로 직접 안내할 수 있습니다. SAVGO는 표현 학습, 가치 추정 및 정책 최적화를 단일 기하학 일관성 목표로 통합하여 오프-폴리시 훈련의 확장성을 유지하며, 연속 제어 과제에서 강력한 성능 개선을 입증했습니다.
HyCOP: PDE 해석 가능한 학습을 위한 하이브리드 조립 연산자
HyCOP는 PDE(편미분 방정식) 해석을 위한 모듈형 프레임워크로, 대류, 확산, 학습된 클로저 등 다양한 구성 요소를 쿼리 조건에 따라 조립하여 파라메트릭 PDE 해 연산자를 학습합니다. 이 프레임워크는 단일 거대 모델 대신 짧은 프로그램의 정책을 학습함으로써, 임의의 시간에 하이브리드 근사기를 평가할 수 있습니다. HyCOP는 다양한 PDE 벤치마크에서 OOD(Out-of-Distribution) 성능을 기존 거대 신경 연산자 대비 10배 이상 개선하며, 모듈형 전이와 오차 분해 분석 기능을 제공하여 해석 가능성과 견고성을 높였습니다.
제약 조건 탐색을 위한 페널티 정규화를 통한 전역 최적성
본 연구는 안전성이나 자원 등의 제약 조건이 존재하는 환경에서 효율적이고 전역적으로 최적인 정책을 찾는 문제를 다룹니다. 기존의 방법들이 약한 후회나 에르고딕 평균에 국한되어 실질적인 배포가 어려운 한계를 가졌기 때문에, 본 논문에서는 'Policy Gradient Penalty (PGP)'라는 새로운 방법을 제안합니다. PGP는 볼록 점유 측정 제약 조건을 제곱 페널티 정규화로 강제하고, 정책 경사 정리와 규칙성 분석을 통해 전역적인 근최적 및 거의 실현 가능한 단일 배포 가능 정책의 수렴을 보장하는 것이 핵심입니다.
국소화된 고강도 소스 항을 갖는 문제들을 위한 적응형 웨이블릿 기반 물리 정보 신경망
본 논문은 국소화된 고강도 소스 항으로 인해 발생하는 물리 정보 신경망(PINNs)의 심각한 손실 불균형 문제를 해결하기 위해 적응형 웨이블릿 기반 PINN (AW-PINN)을 제안합니다. AW-PINN은 잔차와 감독 손실에 기초하여 웨이블릿 기저 함수를 동적으로 조정하는 적응적 특성을 가지며, 자동 미분(automatic differentiation) 의 의존성 없이 훈련 과정을 가속화합니다. 이 방법은 극단적인 손실 불균형 비율을 가진 다양한 도전적인 편미분방정식(PDEs)에서 기존 방법들보다 우수한 성능을 입증했습니다.
식물 전기생리학을 통한 물 스트레스 조기 감지: 관수 관리 위한 머신러닝
본 연구는 식물의 전기생리학적 신호를 활용하여 물 스트레스를 조기에 감지하는 머신러닝 프레임워크를 개발했습니다. 온실 토마토를 대상으로 시계열 데이터를 수집하고, 자동화된 머신러닝 기법을 적용한 결과, 30분 데이터 윈도우에서 최대 92%의 높은 분류 정확도를 달성했습니다. 이 시스템은 작물에 가시적 증상이 나타나기 전에 스트레스 상태를 감지하여, 자원 효율성을 높이는 정밀 농업 및 자동화된 관수 관리 시스템 구축의 기반을 제공합니다.
물리 기반 기초 모델: 대규모 신경망의 고정된 하드웨어 구현
기초 모델(Foundation Models)의 급격한 발전은 AI 하드웨어 분야에 새로운 기회를 제시하며, 기존의 디지털 추론 하드웨어를 넘어선 근본적인 변화를 요구합니다. 본 논문은 신경망을 물리 설계 수준에서 직접 구현하고 자연스러운 물리 역학으로 작동하는 '물리 기반 기초 모델(Physical Foundation Models, PFMs)' 개념을 제안합니다. PFM은 에너지 효율성, 속도, 파라미터 밀도 면에서 기존 방식보다 수배 이상의 이점을 제공하며, 데이터센터의 전력 문제를 해결하고 엣지 디바이스에서의 대규모 AI 구현을 가능하게 할 것으로 기대됩니다.
간호학적 시계열 해석 가능한 예상을 위한 미분 가능 잠재 구조 발견
본 논문은 전자의무기록(EHR)의 불규칙한 시계열 데이터에서 신뢰할 수 있고 해석 가능한 예측을 수행하기 위해 StructGP라는 새로운 연속 시간 다목적 가우시안 프로세스를 제안합니다. 이 모델은 프로세스 컨볼루션과 미분 가능 구조 학습을 결합하여 변수 간 의존성의 희소하고 순차적인 방향성 비순환 그래프(DAG)를 드러내면서 원칙에 기반한 불확실성을 보존합니다. 나아가, 개인별 경로-공유 및 시간적 궤적 정보를 추가한 LP-StructGP는 환자 진행 패턴 포착 능력을 향상시키며, 실제 임상 데이터셋(MIMIC-IV)과 대규모 챌린지에서 기존 모델 대비 우수한 예측 정확도와 보정된 불확실성을 입증했습니다.
Auto-FlexSwitch: 학습 가능한 작업 벡터 압축을 통한 효율적인 동적 모델 병합
Auto-FlexSwitch는 학습 가능한 작업 벡터 압축 및 관리 기법을 통해 기존의 동적 모델 병합(dynamic model merging)이 가진 높은 저장 오버헤드 문제를 해결하는 새로운 프레임워크입니다. 이 방법은 작업별 가중치 증분(task vectors)을 이진 희소 마스크, 부호 벡터, 스칼라 스케일링 인자 세 가지 컴팩트한 요소로 분해하여 고압축률에서도 높은 근사도를 유지합니다. 또한, 기능 유사성 검색과 학습 가능한 게이팅 및 양자화 전략을 통합함으로써 효율적이고 적응적인 모델 병합을 가능하게 합니다.
구조 인식 기반 밀도화를 통한 더 빠른 3D Gaussian Splatting 수렴
본 논문은 실시간 새로운 관점 합성(novel-view synthesis) 분야의 강력한 표현 방식인 3D Gaussian Splatting의 수렴 속도와 품질 문제를 해결하기 위해 구조 인식 기반 밀도화 프레임워크를 제안합니다. 기존 방법들이 스크린 공간 기울기에 의존하여 고주파 디테일을 손실하거나 과밀도화를 초래하는 한계를 극복하고자 합니다. 핵심적으로, 본 연구는 구조 텐서와 라플라시안 스케일 공간 분석을 결합한 다중 스케일 주파수 분석을 통해 각 가우시안의 국부적 구조를 파악하고, 이를 기반으로 비등방성 분할(anisotropic splitting)을 수행하여 빠르고 정확하게 고주파 디테일을 재구성합니다.
신경망 보조 칼만 필터: 열화된 감지 환경에서의 UAV 상태 추정
본 논문은 비선형적이고 노이즈가 심하며 센서 측정값이 희소한 열악한 환경에서 무인항공기(UAV)의 상태를 정확하게 추정하기 위한 하이브리드 프레임워크, 베이지안 신경 칼만 필터(BNKF)를 제안합니다. BNKF는 베이지안 신경망(BNNs)을 사용하여 불확실성을 정량화하고 이를 칼만 필터 단계에 통합하여, 기존의 확장/무향 칼만 필터보다 높은 정확도와 강건성을 보여줍니다. 실험 결과, BNKF는 다양한 노이즈 조건에서 우수한 성능을 입증했으며, 실시간 배포가 가능함을 확인했습니다.
TwinGate: 비대칭 대조 학습을 통한 추적 불가능한 트래픽에서 분해형 제이브레이크에 대한 상태 유지 방어
TwinGate는 분해형 제이브레이크와 같은 추적 불가능한 트래픽 환경에서 LLM의 상태 유지 방어 메커니즘을 제시하는 듀얼 인코더 프레임워크입니다. 이 시스템은 비대칭 대조 학습(ACL)을 활용하여, 의미적으로 차별적이면서도 의도가 일치하는 악성 파편들을 효과적으로 클러스터링합니다. TwinGate는 단일 경량 포워드 패스를 통해 낮은 지연 시간으로 높은 악의적 의도 회수율과 낮은 위양성률을 달성하며, 적응형 공격에 대해 강력한 방어 성능을 보여줍니다.
개인정보 보호를 위한 개인화 연동 미세 조정에서 소음 유발 프로토타입 열화를 제어하기
본 논문은 개인정보 보호를 유지하면서 여러 도메인에 걸쳐 모델을 적응시키는 ProtoPFL(프로토타입 기반 개인화 연동 학습)의 프라이버시 문제를 해결하기 위해 VPDR이라는 클라이언트 측 플러그인을 제안합니다. 기존 방식이 모든 차원에 균일한 소음을 추가하여 판별적 정보를 과도하게 손상시키는 단점을 보완하고자, 본 연구는 '분산 적응형 프로토타입 교란(VPP)'을 도입했습니다. VPP는 데이터의 판별성을 반영하는 부분 공간에는 적은 노이즈를 할당하고, 의미론적 분리 가능성은 유지하면서 프라이버시를 확보하여 우수한 성능과 개인정보 보호 균형을 달성합니다.
이 피드 구독하기
본 페이지의 콘텐츠는 AI가 공개된 소스를 기반으로 자동 수집·요약·번역한 것입니다. 원 저작권은 각 원저작자에게 있으며, 각 게시물의 “원문 바로가기” 링크를 통해 원문을 확인할 수 있습니다. 저작권자의 삭제 요청이 있을 경우 신속히 조치합니다.