본문으로 건너뛰기

© 2026 Molayo

Insights

AI가 자동으로 큐레이션·번역·정리하는 기술 동향 피드입니다.

arXiv cs.LG 2016필터 해제

arXiv논문

슬라이스 발산(Sliced Divergences)을 이용한 다변량 분포 강화학습 (Multivariate Distributional

다변량 수익 분포를 모델링하는 과정에서 발생하는 계산적 복잡성과 수축성 문제를 해결하기 위한 슬라이스 분포 강화학습(SDRL)을 제안합니다. 투영을 통해 1차원 발산을 다변량으로 확장하며, 다양한 할인 행렬 환경에서의 벨만 수축을 증명합니다.

6월 1일0
arXiv논문

그래프 제약 경로 선택을 통한 멀티홉(Multi-Hop) 학습 데이터 스케일링

전문 문서에서 멀티홉 추론 데이터를 효율적으로 생성하기 위해 그래프 제약 경로 선택(GCSCS) 기법을 제안합니다. 기존 방식의 한계를 극복하여 데이터 합성 가능성을 높임으로써, 법률 코퍼스 기반 학습 시 모델 성능을 대폭 향상시켰습니다.

6월 1일0
arXiv논문

조화 포텐셜 (Harmonic Potentials)에 의해 지배되는 3차원 경계값 문제(Boundary Value Problems)를 위한

조화 포텐셜과 휘태커 적분 공식을 활용하여 3차원 경계값 문제를 해결하는 새로운 신경망 프레임워크를 제안합니다. 정칙 신경망을 통해 PDE를 구조적으로 만족함으로써, 도메인 내부 잔차 최소화 없이 경계 조건만으로 학습이 가능한 것이 특징입니다.

6월 1일0
arXiv논문

분기형 잔여 수명 예측: 현실적인 불확실성 특성화를 위한 하이브리드 접근 방식

NASA C-MAPSS 데이터셋을 활용하여 터보팬 엔진의 잔여 수명(RUL)을 예측하는 하이브리드 프레임워크를 제안합니다. 엔진 상태를 정상과 열화 영역으로 분기하여 각각 생존 분석과 확률적 신경망을 적용함으로써 불확실성을 정밀하게 포착합니다.

6월 1일0
arXiv논문

스펙트럼 도달 범위 (Spectral Reach): 스펙트럼 꼬리(Spectral Tail)로의 진전으로서의 신경 스케일링 이해

신경 스케일링 법칙의 근간을 이해하기 위해 '스펙트럼 위치'라는 새로운 척도를 도입합니다. 학습이 진행됨에 따라 모델이 지배적 모드에서 스펙트럼 꼬리로 이동하며, 더 큰 모델일수록 더 깊은 꼬리 부분까지 도달하는 '스펙트럼 도달 범위'를 가짐을 밝힙니다.

6월 1일0
arXiv논문

식별 가능한 희소 오토인코더 (Identifiable Sparse Autoencoders)를 향하여

희소 오토인코더(SAE)의 불안정성 문제를 이론적으로 규명하고, 이를 해결하기 위한 식별 가능한 SAE(iSAE)를 제안합니다. 아키텍처와 학습 절차 개선을 통해 재구성 오차를 낮추고 개념 사전의 안정성을 높였습니다.

6월 1일0
arXiv논문

Spallation Neutron Source의 고전압 컨버터 변조기를 위한 경량 CNN 기반 이상 탐지

Spallation Neutron Source(SNS)의 고전압 컨버터 변조기 결함을 탐지하기 위해 경량 CNN 기반의 이상 탐지 모델을 제안합니다. 시간적 필터링과 채널 간 혼합 순서를 최적화하여 기존 딥러닝 모델의 한계를 극복하고 높은 탐지 성능을 입증했습니다.

6월 1일0
arXiv논문

정형 데이터를 위한 인컨텍스트 러닝 (In-Context Learning)의 알고리즘적 구제 (Algorithmic Recourse)

본 연구는 LLM의 인컨텍스트 러닝(ICL)을 활용한 정형 데이터 예측 환경에서 알고리즘적 구제(Algorithmic Recourse)를 다루는 첫 번째 연구입니다. 이론적 분석을 통해 컨텍스트 크기에 따른 구제의 수렴성을 규명하고, 효율적인 구제 생성을 위한 새로운 프레임워크인 ASR-ICL을 제안합니다.

6월 1일0
arXiv논문

사기 유형 분해와 관찰 메커니즘 분류 체계: 결제 네트워크에서의 클래스별 탐지 한계

결제 네트워크 내 사기 탐지 시 사기를 단일 이진 변수로 취급하는 기존 방식의 한계를 지적합니다. 사기를 다섯 가지 클래스로 분류하는 새로운 체계를 도입하여, 각 클래스별 관찰 메커니즘에 따른 탐지 제약 조건을 이론적으로 증명합니다.

6월 1일0
arXiv논문

생존 강화학습 (Survival Reinforcement Learning): 확장 가능한 자기지도 강화학습 (Self-Supervised

자기지도 대조 강화학습(CRL)의 한계를 극복하기 위해 목표 지점 체류 시간을 최대화하는 생존 강화학습(SRL) 프레임워크를 제안합니다. SRL은 복잡한 동적 시스템에서의 제어 문제를 완화하며, 로봇 보행 작업에서 기존 CRL보다 월등한 성능을 입증했습니다.

6월 1일0
arXiv논문

뉴로 심볼릭 회귀 (Neuro Symbolic Regression)를 이용한 매개변수적 질소 비료 반응 곡선 학습

정밀 농업을 위해 뉴로 심볼릭 회귀(Neuro Symbolic Regression)를 활용하여 질소 비료 반응 곡선을 학습하는 새로운 연구를 제안합니다. 트랜스포머 기반의 전략과 유전 알고리즘을 결합하여 데이터로부터 해석 가능한 수식을 자동으로 발견합니다.

6월 1일0
arXiv논문

GETA: 일반화된 암호화 트래픽 분석

GETA는 패킷 페이로드 대신 트래픽 메타데이터를 다변량 시계열로 모델링하여 프로토콜에 구애받지 않는 암호화 트래픽 분석 프레임워크를 제안합니다. 메타 러닝과 셀프 어텐션을 결합하여 최소한의 데이터로도 새로운 도메인에 빠르게 적응하며, 다양한 네트워크 환경에서 뛰어난 성능을 입증했습니다.

6월 1일0
arXiv논문

PARCEL: 효율적인 시각-언어 이해를 위한 조건부 탄력적 쿼리를 이용한 풀 앵커링 재샘플링 (Pool-Anchored Resampling

PARCEL은 LVLM의 계산 병목 현상을 해결하기 위해 제안된 시각적 토큰 압축 아키텍처입니다. 공간 풀 토큰을 앵커로 활용하여 쿼리 토큰이 상호 보완적인 시각적 특징에 집중하도록 유도함으로써, 다양한 토큰 예산에서도 높은 성능과 효율성을 유지합니다.

5월 29일1
arXiv논문

무선 채널 상의 xMK-CKKS를 통한 프라이버시 강화형 Zero-Order 연합 학습 (Federated Learning)

무선 채널 환경에서 xMK-CKKS 다중 키 동형 암호를 활용하여 프라이버시를 강화한 Zero-Order 연합 학습 프로토콜을 제안합니다. 채널 추정 없이도 보안성을 유지하며, 통신 및 암호화 오버헤드가 모델 차원과 무관하게 효율적으로 작동함을 증명했습니다.

5월 29일0
arXiv논문

새로운 작업으로의 외삽 학습: 작업 외삽을 위한 관계적 접근 방식

훈련 분포를 벗어난 미지의 작업으로 일반화하는 문제를 해결하기 위해 관계적 작업 외삽기(RTE) 알고리즘을 제안합니다. RTE는 작업 간의 변환 관계를 학습하여 매개변수, 길이, 구성적 외삽 등 다양한 시나리오에서 기존 방식보다 뛰어난 성능을 보입니다.

5월 29일0
arXiv논문

DAMEL: 클래스 불균형 학습을 위한 이축 다중 전문가 학습 (Dual-Axis Multi-Expert Learning)

DAMEL은 클래스 불균형 학습 시 발생하는 예측 편향과 분산 문제를 동시에 해결하기 위한 새로운 다중 전문가 학습 알고리즘입니다. 표현 축과 시간 축 모두에서 전문가를 활용하여 예측 성능을 최적화합니다.

5월 29일0
arXiv논문

진화 전략 (Evolution Strategies)을 이용한 LLM 미세 조정 시 망각 문제 극복

진화 전략(ES)을 이용한 LLM 미세 조정 시 발생하는 성능 드리프트와 망각 문제를 분석합니다. 연구 결과, 망각은 가중치 공간의 랜덤 워크로 인한 현상이며, 이를 해결하기 위해 파라미터 공간 정규화 기술인 AWD를 제안합니다.

5월 29일0
arXiv논문

RL2ML: 강화학습에서 최대 가능도(Maximum Likelihood)로의 유한 롤아웃 대리 목적 함수 (Finite-Rollout

RLVR 학습 시 발생하는 목적 함수와 확률적 업데이트 기하학 간의 불일치 문제를 해결하기 위한 RL2ML 프레임워크를 제안합니다. 유한 롤아웃 환경에서 편향되지 않은 그래디언트 추정기를 통해 표준 RL과 최대 가능도 학습을 연속적으로 연결합니다.

5월 29일0
arXiv논문

확산 모델(Diffusion Models)은 저차원 다중 모드 분포(Multi-Modal Distributions) 학습에 통계적으로 최적이다

본 연구는 점수 기반 확산 모델이 저차원 다중 모드 분포를 학습할 때의 통계적 효율성을 이론적으로 분석합니다. 기존의 강력한 정규성 가정 없이도 확산 모델이 본질적 차원에 의존하는 근사 최적의 수렴 속도를 가짐을 증명했습니다.

5월 29일0
arXiv논문

BioRefusalAudit: 일반 및 도메인 미세 조정된 Sparse Autoencoders를 사용한 생물 보안 거부 깊이 감사

본 논문은 Sparse Autoencoders(SAE)를 활용하여 언어 모델의 생물 보안 거부 메커니즘이 프롬프트 형식이나 출력 길이에 따라 얼마나 취약한지 분석합니다. 연구 결과, 모델들이 유해성과 무해성을 명확히 구분하지 못하거나 특정 조건에서 거부율이 급락하는 등 구조적 결함이 있음을 밝혀냈습니다.

5월 29일0

이 피드 구독하기

본 페이지의 콘텐츠는 AI가 공개된 소스를 기반으로 자동 수집·요약·번역한 것입니다. 원 저작권은 각 원저작자에게 있으며, 각 게시물의 “원문 바로가기” 링크를 통해 원문을 확인할 수 있습니다. 저작권자의 삭제 요청이 있을 경우 신속히 조치합니다.