Insights
AI가 자동으로 큐레이션·번역·정리하는 기술 동향 피드입니다.
arXiv cs.LG 2046건필터 해제
뉴로 심볼릭 회귀 (Neuro Symbolic Regression)를 이용한 매개변수적 질소 비료 반응 곡선 학습
정밀 농업을 위해 뉴로 심볼릭 회귀(Neuro Symbolic Regression)를 활용하여 질소 비료 반응 곡선을 학습하는 새로운 연구를 제안합니다. 트랜스포머 기반의 전략과 유전 알고리즘을 결합하여 데이터로부터 해석 가능한 수식을 자동으로 발견합니다.
GETA: 일반화된 암호화 트래픽 분석
GETA는 패킷 페이로드 대신 트래픽 메타데이터를 다변량 시계열로 모델링하여 프로토콜에 구애받지 않는 암호화 트래픽 분석 프레임워크를 제안합니다. 메타 러닝과 셀프 어텐션을 결합하여 최소한의 데이터로도 새로운 도메인에 빠르게 적응하며, 다양한 네트워크 환경에서 뛰어난 성능을 입증했습니다.
PARCEL: 효율적인 시각-언어 이해를 위한 조건부 탄력적 쿼리를 이용한 풀 앵커링 재샘플링 (Pool-Anchored Resampling
PARCEL은 LVLM의 계산 병목 현상을 해결하기 위해 제안된 시각적 토큰 압축 아키텍처입니다. 공간 풀 토큰을 앵커로 활용하여 쿼리 토큰이 상호 보완적인 시각적 특징에 집중하도록 유도함으로써, 다양한 토큰 예산에서도 높은 성능과 효율성을 유지합니다.
무선 채널 상의 xMK-CKKS를 통한 프라이버시 강화형 Zero-Order 연합 학습 (Federated Learning)
무선 채널 환경에서 xMK-CKKS 다중 키 동형 암호를 활용하여 프라이버시를 강화한 Zero-Order 연합 학습 프로토콜을 제안합니다. 채널 추정 없이도 보안성을 유지하며, 통신 및 암호화 오버헤드가 모델 차원과 무관하게 효율적으로 작동함을 증명했습니다.
새로운 작업으로의 외삽 학습: 작업 외삽을 위한 관계적 접근 방식
훈련 분포를 벗어난 미지의 작업으로 일반화하는 문제를 해결하기 위해 관계적 작업 외삽기(RTE) 알고리즘을 제안합니다. RTE는 작업 간의 변환 관계를 학습하여 매개변수, 길이, 구성적 외삽 등 다양한 시나리오에서 기존 방식보다 뛰어난 성능을 보입니다.
DAMEL: 클래스 불균형 학습을 위한 이축 다중 전문가 학습 (Dual-Axis Multi-Expert Learning)
DAMEL은 클래스 불균형 학습 시 발생하는 예측 편향과 분산 문제를 동시에 해결하기 위한 새로운 다중 전문가 학습 알고리즘입니다. 표현 축과 시간 축 모두에서 전문가를 활용하여 예측 성능을 최적화합니다.
진화 전략 (Evolution Strategies)을 이용한 LLM 미세 조정 시 망각 문제 극복
진화 전략(ES)을 이용한 LLM 미세 조정 시 발생하는 성능 드리프트와 망각 문제를 분석합니다. 연구 결과, 망각은 가중치 공간의 랜덤 워크로 인한 현상이며, 이를 해결하기 위해 파라미터 공간 정규화 기술인 AWD를 제안합니다.
RL2ML: 강화학습에서 최대 가능도(Maximum Likelihood)로의 유한 롤아웃 대리 목적 함수 (Finite-Rollout
RLVR 학습 시 발생하는 목적 함수와 확률적 업데이트 기하학 간의 불일치 문제를 해결하기 위한 RL2ML 프레임워크를 제안합니다. 유한 롤아웃 환경에서 편향되지 않은 그래디언트 추정기를 통해 표준 RL과 최대 가능도 학습을 연속적으로 연결합니다.
확산 모델(Diffusion Models)은 저차원 다중 모드 분포(Multi-Modal Distributions) 학습에 통계적으로 최적이다
본 연구는 점수 기반 확산 모델이 저차원 다중 모드 분포를 학습할 때의 통계적 효율성을 이론적으로 분석합니다. 기존의 강력한 정규성 가정 없이도 확산 모델이 본질적 차원에 의존하는 근사 최적의 수렴 속도를 가짐을 증명했습니다.
BioRefusalAudit: 일반 및 도메인 미세 조정된 Sparse Autoencoders를 사용한 생물 보안 거부 깊이 감사
본 논문은 Sparse Autoencoders(SAE)를 활용하여 언어 모델의 생물 보안 거부 메커니즘이 프롬프트 형식이나 출력 길이에 따라 얼마나 취약한지 분석합니다. 연구 결과, 모델들이 유해성과 무해성을 명확히 구분하지 못하거나 특정 조건에서 거부율이 급락하는 등 구조적 결함이 있음을 밝혀냈습니다.
SAHG: 소셜 봇 탐지를 위한 섹터-비등방성 쌍곡선 그래프 모델
LLM 기반 소셜 봇 탐지를 위해 섹터-비등방성 쌍곡선 그래프(SAHG) 모델을 제안합니다. 기존 유클리드 GNN의 한계를 극복하기 위해 방향 의존적 곡률을 학습하고, 이중 채널 설계를 통해 봇과 인간의 신호가 섞이는 문제를 해결합니다.
카오스 역학계에서의 분포 강화학습 (Distributional Reinforcement Learning)에 관하여
카오스 역학계에서 발생하는 강화학습의 불안정성 문제를 해결하기 위해 분포형 강화학습(Distributional RL)의 효용성을 분석합니다. 수익 분포가 개별 궤적보다 통계적으로 더 안정적임을 증명하여 더 매끄러운 벨만 목적 함수를 생성하는 원리를 설명합니다.
Vision-Language Models에서의 시각적 계수 병목 현상 규명
대규모 시각-언어 모델(VLMs)이 시각적 계수(counting)에서 겪는 외삽 실패 원인을 분석한 연구입니다. 연구 결과, 모델의 실패는 지각의 문제가 아니라 시각적 크기를 기호 토큰으로 연결하는 '기호 매핑' 단계의 결함임을 밝혀냈습니다.
시각적 공간 학습: 합성곱 신경망 (CNN)을 이용한 단일 필드 공간 보간
본 연구는 CNN을 활용하여 희소한 관측값으로부터 완전한 공간 상관 필드를 예측하는 새로운 보간법을 제안합니다. 전통적인 Kriging 방식과 달리 명시적인 공분산 모델링 없이 데이터 기반으로 국소적 공간 패턴을 유연하게 포착합니다.
iLoRA: 마이크로바이옴 진단을 위한 잠재 상호작용 그래프 기반 베이지안 저차원 적응 (Bayesian Low-Rank Adaptation)
iLoRA는 잠재적 상호작용 그래프를 추론하여 입력 조건부 LoRA 업데이트를 생성하는 최초의 베이지안 그래프 조건부 LoRA 프레임워크입니다. 마이크로바이옴 진단 분야에 적용하여 예측 성능을 높이고 미생물 간의 상호작용 구조를 효과적으로 회복함을 입증했습니다.
AI 기상 모델은 2주 이상을 예측할 수 있는가? 장기 롤아웃 (Long Rollouts)에 대한 정량적 벤치마크 및 분석
AI 기상 모델의 장기 예측 시 발생하는 불안정성 문제를 분석한 연구입니다. 9개의 최첨단 모델을 대상으로 폭발, 드리프트, 계절성 상실이라는 세 가지 실패 유형을 정의하고, 모델의 안정성이 시공간적 규모 처리 방식에 달려 있음을 규명했습니다.
CalArena: 대규모 사후 교정 (Post-Hoc Calibration) 벤치마크
현대 분류기들의 신뢰할 수 있는 확률 추정을 위해 대규모 사후 교정(Post-Hoc Calibration) 벤치마크인 CalArena를 제안합니다. 정형 데이터와 컴퓨터 비전 등 다양한 태스크에서 2,000개 이상의 실험을 통해 기존 방법론들을 통합적으로 평가하고 분석합니다.
분자 MPNN의 성능을 결정하는 요인은 무엇인가? 연산자 수준의 요인 설계 벤치마크
분자 특성 예측을 위한 MPNN의 성능 결정 요인을 분석하기 위해 연산자 수준의 요인 설계 벤치마크를 제안합니다. 연구 결과, 성능은 업데이트 복잡성보다 메시지 구축 방식에 더 큰 영향을 받으며, 결합 기반 혼합이 화학적 구별 능력과 오버스무딩 저항성 측면에서 우수함을 입증했습니다.
Mean-Field Diffuser: 수천 명의 에이전트로 오프라인 MARL 확장하기
MF-Diffuser는 확산 기반 계획을 활용하여 수천 명의 에이전트를 포함하는 다중 에이전트 오프라인 강화학습(MARL) 문제를 해결하는 프레임워크입니다. 와세르슈타인 공간과 혼돈의 전파 원리를 이용해 차원의 저주를 극복하고 대규모 에이전트 시스템에서도 높은 성능을 증명했습니다.
LoRA 어댑터 백도어의 토큰 수준 일반화: 공격 특성 분석 및 행동 기반 탐지
LoRA 어댑터가 데이터 오염을 통해 기본 성능을 유지하면서도 백도어를 심을 수 있음을 증명한 연구입니다. 공격이 구조적 패턴이 아닌 토큰 특징 수준에서 일반화되어 특정 참조 유형에만 활성화되는 특성을 분석했습니다.
이 피드 구독하기
본 페이지의 콘텐츠는 AI가 공개된 소스를 기반으로 자동 수집·요약·번역한 것입니다. 원 저작권은 각 원저작자에게 있으며, 각 게시물의 “원문 바로가기” 링크를 통해 원문을 확인할 수 있습니다. 저작권자의 삭제 요청이 있을 경우 신속히 조치합니다.