Insights
AI가 자동으로 큐레이션·번역·정리하는 기술 동향 피드입니다.
arXiv cs.LG 271건필터 해제
실제 하드웨어를 위한 양자 노이즈 모델링의 퓨샷 크로스-디바이스 전송
본 논문은 NISQ 시대에 하드웨어 고유 노이즈를 포함하는 실제 양자 장치에서 학습된 노이즈 모델을 다른 장치로 전송하는 퓨샷 크로스-디바이스 전송 학습 접근법을 제안합니다. 연구진은 두 IBM 양자 장치를 사용하여 대규모의 실제 하드웨어 데이터셋을 구축하고, 출처 장치에서 잔여 신경망(RNN)을 학습시켜 노이즈 결과를 이상 결과로 매핑했습니다. 그 결과, 소량의 파인튜닝 샘플만으로도 제로샷 전송 대비 상당한 성능 개선을 입증하며, 이는 크로스-디바이스 양자 오차 완화에 효과적인 방법론임을 보여줍니다.
강화학습 기반 자동 지상 충돌 회피 시스템 (AGCAS)
본 논문은 고급 제트 훈련기 운용 효과를 높이기 위해 강화학습 기반의 자동 지상 충돌 회피 시스템(AGCAS)을 평가합니다. 이 시스템은 제한된 관측 공간 내에서 AI를 활용하여 정밀하고 효율적인 충돌 회피를 수행하는 것을 목표로 합니다. 특히, AGCAS는 지형 서버에 대한 시선 쿼리(line-of-sight query)를 활용함으로써 항공기의 안전성과 운용 능력을 크게 향상시킬 수 있습니다.
사전 학습 분자 임베딩 거리를 활용한 리간드 기반 가상 스크리닝 및 분자 생성 고도화
본 연구는 기존의 계산 비용이 높거나 특정 작업에 의존하는 분자 유사성 측정 방법의 한계를 극복하기 위해, 사전 학습된 분자 임베딩 거리(PED: pretrained embedding distance)를 효과적인 대안으로 제시한다. PED는 별도의 훈련 없이도 풍부한 구조 정보를 포착하며, 가상 스크리닝을 위한 분자 순위 매기기와 목표 지향적 분자 생성 유도 등 다양한 약물 개발 과정에서 높은 성능을 보였다. 이는 사전 학습된 분자 임베딩이 AI 기반 신약 개발에 확장 가능하고 강력한 유사성 측정 도구로 활용될 수 있음을 입증한다.
Prior-Agnostic Robust Forecast Aggregation
본 논문은 다양한 정보 출처의 예측을 결합하여 최악의 경우 성능을 보장하는 '강건한(Robust) 예측 집계' 기법에 관한 연구입니다. 기존 연구가 알려진 이진 상태 공간({0, 1})에 국한되었던 것과 달리, 본 논문은 집계기가 근본적인 공동 정보 구조나 전체 사전 분포를 알지 못하는 상황을 가정합니다. 핵심 기여는 로그-오즈(log-odds) 공간에서 예측을 선형적으로 결합하는 간단하고 명시적인 폐쇄형 공식의 집계기이며, 이를 통해 다양한 지식 체제 하에서 강력한 최소-최대 후회(minimax-regret) 보장을 제시합니다.
다목적 강화학습에 대한 보상무관 관점
본 논문은 다목적 강화학습(MORL) 문제를 해결하기 위해 보상무관 강화학습(RFRL)을 활용하는 새로운 알고리즘적 관점을 제시합니다. 기존 MORL 접근법이 가중치 기반의 단일 정책 학습에 의존했던 것과 달리, RFRL은 모든 가능한 보상 함수에 대해 최적의 정책을 학습할 수 있어 미지의 사용자 선호도 처리에 자연스럽게 적합합니다. 연구진은 RFRL의 학습 목표를 MORL에 통합하여 지식 공유를 극대화하고, 환경 관련 부분에 집중하는 탐색 전략을 도입함으로써 기존 방법들보다 우수한 성능과 데이터 효율성을 달성했음을 입증했습니다.
확률적 동시 낙관적 최적화
본 논문은 노이즈에 의해 교란된 함수 $f$의 전역 최대화 문제를 다루며, 특히 함수의 전역 최대점 근처에서 국소적인 매끄러움이라는 매우 약한 가정만을 사용합니다. 제안하는 알고리즘인 StoSOO는 계층적 분할과 낙관적 전략을 사용하여 상부 신뢰 구간(UCB)을 반복적으로 구성하고 다음 샘플링 지점을 결정합니다. 이 방법은 함수의 국소 매끄러움에 대한 사전 지식이 없어도 기존의 최적화 알고리즘과 유사한 성능을 달성함을 이론적으로 입증했습니다.
Extreme bandits
본 논문은 의학, 보안 등 다양한 분야에서 제한된 자원을 여러 출처에 순차적으로 할당할 때, 단순히 평균 보상을 최대화하는 것을 넘어 가장 극단적인 값(outlier)을 탐지하는 효율적인 방법을 연구합니다. 기존 밴디트 이론이 주로 '최대 평균 보상'의 후회(regret)를 다루는 것과 달리, 본 연구에서는 출처가 출력한 가장 극단적인 값을 탐지하는 데 초점을 맞춘 '극단적 후회(extreme regret)' 개념을 도입합니다. 이를 위해 ExtremeHunter라는 새로운 알고리즘을 제안하고, 이론적 분석 및 실제 세계 실험을 통해 그 성능을 검증했습니다.
장기 전자의무기록을 활용한 급성신부전 환자의 신중독 위험 예측 및 치료 효과 추정
본 연구는 장기 전자의무기록(EHR)을 활용하여 급성신부전 환자에게서의 신중독 위험을 예측하고, 특정 약물 노출이 치료 효과에 미치는 영향을 추정하는 모델을 개발했습니다. 9만 명 이상의 대규모 코호트를 사용하여 진단, 수술, 약물 시퀀스를 모델링했으며, 트랜스포머 기반 인과 다중 헤드 모델을 통해 약물의 평균 치료 효과(ATEs)를 계산했습니다. 분석 결과, ACE/ARB 계열 약물 노출은 부분적인 보호 경향을 보인 반면, 루프 이뇨제는 신장 기능 악화와 관련된 위험 신호를 제시하여 임상적 의사결정에 중요한 근거를 제공합니다.
GSC-QEMit: 시간 변화 노이즈에 대응하는 적응형 양자 오류 완화를 위한 계층적 예측-밴디트 프레임워크
GSC-QEMit은 시간 변화하는 노이즈 환경에서 양자 오류 완화(QEM)의 효율성을 높이기 위해 설계된 적응형 프레임워크입니다. 이 시스템은 스트리밍 원격 탐사 데이터를 분석하여 운영 컨텍스트를 파악하고, 가우시안 프로세스를 통해 단기 충실도 저하를 예측하며, 비용을 고려한 다팔밴디트(MAB)를 사용하여 최적의 완화 행동을 결정합니다. 실험 결과, GSC-QEMit은 비정상적인 노이즈 환경에서도 논리 충실도를 크게 향상시키면서 불필요한 개입을 줄여 우수한 트레이드오프 성능을 입증했습니다.
사이드 관측이 있는 밴디트 문제에서의 암묵적 탐색을 통한 효율적 학습
본 논문은 학습자가 완전한 정보가 아닌, 일부 행동의 손실만 관측할 수 있는 부분 관측성(partial observability) 온라인 학습 문제를 다룹니다. 저자들은 이러한 환경에서 근사 최적의 후회 보증을 제공하는 새로운 알고리즘 두 가지를 제안합니다. 이 알고리즘들은 '암묵적 탐색(implicit exploration)'이라는 효율적인 전략에 의존하며, 이는 기존 연구 대비 계산적 및 정보 이론적으로 더 우수함을 입증했습니다.
등변성 기계 학습 밀도를 통한 분자 동역학 강화
본 논문은 기계 학습 원자간 퍼텐셜(MLIPs)의 한계를 극복하고, 쌍극자 모멘트와 분극률 같은 전자 관측량까지 접근 가능한 '밀도 우선(density-first)' 기계 학습 전자 구조 접근법인 DenSNet을 제안합니다. DenSNet은 SE(3)-등변성 신경망과 $\Delta$-학습 전략을 결합하여 원자 중심 가우스 기저의 밀도 계수를 예측하고, 이를 총 에너지로 매핑함으로써 분자 동역학과 전자 구조를 통합적으로 다룰 수 있는 프레임워크를 제공합니다. 이 방법은 에탄올 및 폴리티오펜 올리고머와 같은 시스템에서 실험적 스펙트럼과 일치하는 안정적인 장기 궤적을 성공적으로 생성하여, 대규모 분자 시뮬레이션의 예측 가능성을 크게 향상시킵니다.
공간 - 시간 그래프 신경망을 활용한 암호화폐 시장 사기 탐지
본 논문은 암호화폐 시장의 사기 거래를 탐지하기 위해 공간-시간 그래프 신경망(STGNN)을 활용하는 방법을 제안합니다. 기존 방식이 개별 자산과 거래를 독립적으로 처리했던 것과 달리, 이 방법론은 시장 조작이 관계적 구조와 시간적 패턴에 의존한다는 점에 착안하여, 주의 기반 공간 집계와 시간적 Transformer 인코딩을 결합한 통합 그래프 아키텍처를 사용합니다. 실제 데이터셋 평가 결과, 제안된 그래프 기반 모델이 기존의 표준 기계 학습 방식보다 시장 조작 스킴 탐지에서 유의미하게 높은 성능을 보였습니다.
비선형 관측을 갖는 선형 시스템에 대한 이중 제어와 신뢰 공간 모델 예측 제어
본 논문은 비선형 관측(bilinear observations)을 갖는 선형 시스템의 유한 시간 구간 이차 제어 문제를 다룹니다. 기존의 분리 원리가 실패할 수 있는 이 설정에서, 상태 추정에는 입력 의존성 칼만 필터가 필요합니다. 이를 해결하기 위해, 연구진은 신뢰 공간 모델 예측 제어(B-MPC)를 제안하며, 이는 입력 의존적 칼만 필터에 의해 정의된 신뢰 진화의 결정론적 대리자를 사용하여 상태와 오차 공분산을 직접 계획함으로써 기존 방법보다 우수한 성능을 입증했습니다.
위상 공간 위의 연속 함수 집합의 전집과 공전집을 이용한 근접 집계 딥러닝에 대한 함자적 서술
본 논문은 위상 공간 위의 연속 함수 집합의 전집과 공전집 개념을 도입하여 합성곱 및 메시지 전달 신경망에 대한 수학적 해석을 제공한다. 이를 통해, 이러한 구조가 가지는 함자적(functorial) 특성을 분석하고, 전집이나 공전집이 되기 위한 장애물(obstructions)을 활용함으로써 기존 신경망 모델의 경험적인 한계를 심화하는 이론적 휴리스틱을 제시한다.
유방암 생존 예측을 위한 병리 기반 모델 벤치마킹
본 연구는 전체 슬라이드 조직병리 이미지로부터 유방암 생존 예측을 위해 다양한 병리 기반 모델(PFMs)들을 벤치마킹했습니다. 표준화된 파이프라인과 세 개의 독립적인 임상 코호트를 사용하여 모델의 일반화 능력을 엄격하게 검증했으며, 그 결과 H-optimus-1 모델이 가장 우수한 생존 예측 성능을 보였습니다. 또한, 컴팩트한 디스틸드 모델인 H0-mini가 더 큰 스터디어 모델보다 유사하거나 약간 나은 성능을 보이면서 효율적인 임상 배포의 실질적인 지침을 제시했습니다.
Energy-Arena: 운영 에너지 예측을 위한 동적 벤치마크
Energy-Arena는 운영 에너지 시계열 예측 분야의 지속적인 비교 가능성 격차를 해결하기 위해 설계된 동적 벤치마킹 플랫폼입니다. 기존 연구들이 특정 데이터셋과 조건에 국한되어 있어 직접적인 성능 비교가 어려웠던 문제를 해결하며, 이 플랫폼은 실시간으로 업데이트되는 참조점을 제공합니다. API 기반 제출 시스템과 지속 가능한 리더보드를 통해 전향적(forward-looking) 벤치마킹을 수행함으로써 투명성을 높이고 모델의 실제 운영 능력을 평가할 수 있게 합니다.
차분 평탄성을 활용한 제한된 다중 입력 제어 아핀 시스템의 효율적인 학습 기반 모델 예측 제어
본 논문은 로봇 시스템의 불확실성을 다루는 학습 기반 제어 기술의 계산적 비효율성 문제를 해결하기 위해 차분 평탄성(differential flatness) 성질을 활용한 새로운 모델 예측 제어 기법을 제안합니다. 이 방법은 일반적인 다중 입력 비선형 아핀 시스템에 적용 가능하며, 블록 대각 비용 함수와 시스템 확장을 사용하여 효율성을 높였습니다. 또한, 두 번의 순차적 볼록 최적화만으로 확률적 라이아푸노프 감소를 보장하여 높은 성능과 실용성을 입증했습니다.
SpecRLBench: 명세 지향 강화학습의 일반화 성능을 위한 벤치마크
본 논문은 명세 지향 강화학습(Specification-guided reinforcement learning, RL)의 일반화 성능을 체계적으로 평가하기 위해 SpecRLBench라는 새로운 벤치마크를 소개합니다. 이 벤치마크는 항행 및 조작 도메인을 포괄하며, 정적/동적 환경, 다양한 로봇 역학, 여러 관측 모달리티 등 다채로운 난이도와 복잡성을 포함하고 있습니다. SpecRLBench는 기존 방법론들의 강점과 한계를 명확히 규명하고, 향후 더 일반화 가능한 RL 연구 개발을 위한 구조화된 플랫폼을 제공하는 것을 목표로 합니다.
다항식 분류와 리스트 학습의 최적 표본 복잡도
이 기술 기사는 이진 분류에서 다항식 분류와 리스트 학습의 최적 표본 복잡도(sample complexity)를 결정하는 문제를 다룹니다. 기존에는 다항식 분류의 정확한 복잡도 파라미터가 미해결 상태였으나, 최근 연구를 통해 모든 다항식 가설 클래스의 최대 하이퍼그래프 밀도가 $DS$ 차원 이하임을 증명했습니다. 이 결과는 오랜 추측을 입증하며, 다항식 분류와 리스트 학습 모두에 대한 최적 표본 복잡도 의존성을 확립하는 중요한 진전입니다.
리만 기하학적 특징과 RNN 을 활용한 고차원 손가락 운동 디코딩
본 논문은 근전도(EMG) 신호를 활용하여 고차원 손가락 운동학을 연속적으로 추정하는 엔드투엔드 프레임워크를 제시합니다. 기존의 분류 기반 방식이 가진 자유도 제한 문제를 해결하기 위해, 연구진은 8채널 EMG와 손가락 관절 각도를 포함한 대규모 데이터셋(EMG-FK)을 구축했습니다. 핵심 모델인 Temporal Riemannian Regressor (TRR)는 리만 기하학적 특징과 GRU를 결합하여 운동 디코딩의 정확도와 실시간성을 모두 높였으며, 이는 임베디드 시스템에서의 자연스러운 제어 구현 가능성을 입증합니다.
이 피드 구독하기
본 페이지의 콘텐츠는 AI가 공개된 소스를 기반으로 자동 수집·요약·번역한 것입니다. 원 저작권은 각 원저작자에게 있으며, 각 게시물의 “원문 바로가기” 링크를 통해 원문을 확인할 수 있습니다. 저작권자의 삭제 요청이 있을 경우 신속히 조치합니다.