Insights
AI가 자동으로 큐레이션·번역·정리하는 기술 동향 피드입니다.
arXiv cs.LG 2000건필터 해제
LLM 사후 학습 과정에서의 순차적 데이터 오염 (Sequential Data Poisoning)
LLM 사후 학습 과정에서 여러 공격자가 단계별로 데이터를 오염시키는 '순차적 데이터 오염' 위협 모델을 제안합니다. 개별 단계의 공격은 미미해 보일 수 있으나, 단계 간 상호작용을 통해 공격 효과가 가산되거나 상호 보완적으로 작용하여 심각한 취약성을 유발함을 입증했습니다.
평균 기반 알고리즘: 하한선 및 후회 (Regret)
평균 기반 알고리즘의 학습 속도 한계를 규명하기 위해 시간 지평을 모르는 밴딧 피드백 환경에서의 하한선을 제시합니다. $\epsilon$-greedy와 Exp3를 확장한 새로운 알고리즘을 제안하며, 무후회(No-regret) 알고리즘과의 관계를 분석합니다.
STaR-Quant: Diffusion 대규모 언어 모델을 위한 상태-시간 일관성 유지 사후 학습 양자화
Diffusion LLM의 메모리 및 연산 오버헤드를 줄이기 위한 새로운 사후 학습 양자화(PTQ) 프레임워크인 STaR-Quant를 제안합니다. 상태 의존적 활성화 불일치와 시간적 오차 누적 문제를 해결하여 저비트 양자화 성능을 극대화했습니다.
NLLog: 로그-언어 재작성(Log-to-Language Rewriting)을 통한 경량화 및 설명 가능한 SOC 이상 탐지
NLLog는 시스템 로그를 자연어 문장으로 재작성하여 보안 모니터링의 효율성을 높이는 경량 파이프라인을 제안합니다. TF-IDF와 트리 앙상블을 활용해 SOC 이상 탐지 성능을 높였으며, TreeSHAP을 통해 분석 가능한 설명력을 제공합니다.
동적 일관적 서브모듈러 최대화 (Dynamic Consistent Submodular Maximization)를 위한 일반 프레임워크
동적 서브모듈러 최대화 문제에서 삽입과 삭제가 모두 발생하는 완전 동적 환경을 위한 일반 프레임워크를 제안합니다. 준선형 일관성을 가진 최초의 상수 인자 근사 알고리즘을 설계하여 기수 제약 및 매트로이드 제약 조건에서의 성능을 입증했습니다.
공정하게 행동하라! 머신러닝 엔지니어링 (MLE) 에이전트가 공정성 제약 조건을 준수할 수 있는가?
MLE 에이전트가 머신러닝 파이프라인을 자동화할 때 발생할 수 있는 공정성 및 책임 문제를 다룹니다. 기존 벤치마크의 한계를 지적하며, 피부톤 공정성을 중심으로 에이전트의 성능과 신뢰성을 평가하는 새로운 프레임워크를 제안합니다.
AlphaQ: Mixture-of-Experts 양자화를 위한 보정 불필요 비트 할당 방식
AlphaQ는 보정 데이터 없이 MoE 모델의 전문가별 비트 너비를 할당하는 새로운 양자화 방식을 제안합니다. HT-SR 이론을 활용해 가중치 스펙트럼의 무거운 꼬리 특성을 측정함으로써, 데이터 접근이 어려운 상황에서도 최적의 메모리 효율과 정확도를 달성합니다.
행동 추론(Action Inference) 및 중요도 샘플링(Importance Sampling)을 통한 다중 에이전트 학습용 MADDPG
MADDPG 알고리즘의 성능을 개선하기 위해 행동 추론 메커니즘과 기하 분포 기반 중요도 샘플링을 제안합니다. 이를 통해 다중 에이전트 환경의 비정상성을 완화하고 학습 안정성과 탐색 효율성을 높였습니다.
새로운 벤치마킹을 통해 밝혀진 TCR 항원 에피토프 예측 모델의 제한적인 일반화 능력
T 세포 수용체(TCR)의 항원 특이성 예측 모델이 가진 낮은 민감도와 특이도 문제를 다룹니다. 모델의 일반화 능력을 공정하게 평가하기 위해 엄격하게 정의된 새로운 미학습 벤치마크 데이터셋 두 가지를 제안합니다.
Graph Cascades: 구조 인지형 그래프 머신러닝을 위한 전염 기반 중간 규모 재배선 (Mesoscopic Rewiring)
Graph Cascades는 GNN 및 Graph Transformers의 성능 향상을 위해 중간 규모의 그래프 구조를 포착하는 재배선 전략을 제안합니다. 전염 기반 확산 프로세스를 통해 노드 쌍을 직접 이웃으로 승격시키며, 이론적 조건과 실증적 실험을 통해 그 유효성을 입증했습니다.
오토인코더 (Autoencoders)를 통한 제어 아핀 차수 축소 모델 (Control-Affine Reduced-Order Models) 학습
오토인코더(AE)를 활용하여 제어 아핀 차수 축소 모델(ROMs)을 식별하는 새로운 프레임워크를 제안합니다. 고차원 상태와 입력을 저차원 잠재 상태로 변환하며, 시퀀스 기반 모델 확장을 통해 예측 정확도를 높였습니다.
RIDE: 열차 지연 예측을 위한 공개 데이터셋 및 벤치마크
벨기에 철도 네트워크를 기반으로 한 열차 지연 예측용 공개 데이터셋 및 벤치마크인 RIDE를 소개합니다. 방대한 철도 및 기상 데이터를 포함하며, 모델 간 성능 비교를 위한 표준화된 평가 프로토콜을 제공합니다.
FLAGG: 유연한 자기회귀 그래프 생성 (Flexible Autoregressive Graph Generation)
FLAGG는 원샷 모델과 순차적 모델의 한계를 극복하기 위해 두 방식을 유연하게 결합한 새로운 그래프 생성 프레임워크입니다. 확률적 노드 제거 프로세스를 통해 어떤 원샷 모델이라도 자기회귀적으로 변환할 수 있어 다양한 그래프 크기와 도메인에서 뛰어난 성능을 보입니다.
무엇을 결측치로 처리하지 않을 것인가 학습하기: 의미 있는 결측(Meaningful Missingness)을 위한 불확실성 인식 확산
결측치가 발생하는 두 가지 원인을 구분하여 처리하는 Diff-Joint 프레임워크를 제안합니다. 확산 모델을 활용해 의미 있는 결측과 보간이 필요한 결측을 동시에 추론하여 데이터의 정확도를 높입니다.
FoeGlass: 오디오 딥페이크 탐지기 레드팀 활동을 위한 충분하고 간단한 인컨텍스트 러닝 (In-Context Learning)
FoeGlass는 오디오 딥페이크 탐지(ADD) 모델의 취약점을 찾기 위한 최초의 블랙박스 자동 레드팀 방법론입니다. LLM의 인컨텍스트 러닝을 활용해 TTS 모델의 입력 공간을 탐색하며, 탐지 모델을 속이는 오디오 샘플을 자동으로 생성합니다.
Roman RAPID를 통한 보석(Gems) 식별하기
Nancy Grace Roman 우주 망원경의 자동화된 천문 현상 탐지를 위한 머신러닝 파이프라인 연구입니다. 실제 데이터가 부족한 상황에서 $RuBR$ 모델과 도메인 적응 전략을 통해 실재 현상과 가짜 탐지를 효과적으로 구분하는 방법론을 제시합니다.
RePercENT: 두 가지 모달리티를 넘어 확장 가능한 얽힘 해제 표현 학습 (Disentangled Representation
RePercENT는 기존의 두 가지 모달리티 한계를 극복하고 확장 가능한 멀티모달 얽힘 해제 표현 학습을 위한 자기지도 학습 프레임워크입니다. 사전 추출된 임베딩을 활용하는 플러그 앤 플레이 아키텍처를 통해 공동 사전 학습 없이도 공유 및 고유 요소를 효과적으로 식별합니다.
그래프 세트 트랜스포머 (Graph Set Transformer)
그래프 세트 상에서 학습하기 위해 설계된 새로운 신경망 아키텍처인 Graph Set Transformer(GST)를 소개합니다. GST는 노드 수준의 특징 전파와 그래프 간 문맥 모델링을 교차 수행하여 기존 모델의 병목 현상을 해결합니다.
완전 동형 암호 (FHE)를 이용한 인과 구조 학습 시 데이터 프라이버시 보호
본 논문은 완전 동형 암호(FHE)를 활용하여 데이터 프라이버시를 보호하면서 분산 인과 구조 학습을 수행하는 새로운 방법을 제안합니다. FHE의 높은 연산 비용 문제를 해결하기 위해 회로 단순화, 근사 연산, SIMD 가속 기술을 도입하여 실용적인 효율성을 달성했습니다.
Geometry Gaussians: Gaussian Splatting에서 외관과 기하학적 구조의 분리
3D Gaussian Splatting(3DGS)에서 외관과 기하학적 구조를 분리하여 렌더링 품질과 기하학적 정확도를 동시에 높이는 연구를 제안합니다. 각 스플랫에 기하학 불투명도 파라미터를 추가하고 최적화 파이프라인을 결합하여 복잡한 장면에서의 성능을 개선했습니다.
이 피드 구독하기
본 페이지의 콘텐츠는 AI가 공개된 소스를 기반으로 자동 수집·요약·번역한 것입니다. 원 저작권은 각 원저작자에게 있으며, 각 게시물의 “원문 바로가기” 링크를 통해 원문을 확인할 수 있습니다. 저작권자의 삭제 요청이 있을 경우 신속히 조치합니다.