Insights

AI가 자동으로 큐레이션·번역·정리하는 기술 동향 피드입니다.

중요도 평활화(Importance Smoothing)를 통한 심층 상태 공간 모델(Deep State Space Models)의 효율적인 학습

심층 상태 공간 모델(DSSM)의 학습 효율성을 높이기 위해 새로운 학습 방법론인 병렬 변분 몬테카를로(PVMC)를 제안합니다. 기존의 오토인코딩 방식과 SMC 기반 방식 사이의 간극을 메워, 생성적 및 판별적 작업 모두에서 높은 성능을 보이며 기존 SMC 방식 대비 최대 10배 빠른 학습 속도를 달성했습니다.

5월 21일0

arXiv논문

커넥티드 EV의 배터리 지능을 위한 자동화된 비잔틴 내성 클러스터형 분산 연합 학습

본 논문은 커넥티드 전기차(EV)의 배터리 데이터 프라이버시를 보호하면서도 보안성을 강화하기 위한 ABC-DFL 프레임워크를 제안합니다. 중앙 집중식 서버 대신 오픈 허가형 블록체인과 QBFT 프로토콜을 사용하여 비잔틴 공격에 대한 내성을 갖춘 분산형 연합 학습 환경을 구축합니다. 특히 FLECA 프로토콜을 통해 악성 업데이트를 효과적으로 필터링하며, 적대적 시나리오에서도 기존 방식보다 뛰어난 성능을 입증했습니다.

5월 21일0

arXiv논문

CoarseSoundNet: 생태 음경관 분석을 위한 신뢰할 수 있는 모델 구축

CoarseSoundNet은 실제 수동 음향 모니터링(PAM) 환경의 노이즈가 있는 데이터에서도 생물음, 지질음, 인위음을 효과적으로 구분할 수 있도록 설계된 딥러닝 모델입니다. 연구를 통해 무음 클래스 도입과 결정 임계값 조절이 모델 성능을 향상시킨다는 점을 밝혀냈으며, 생태 음향 분석을 위한 효과적인 전처리 도구로서의 가치를 입증했습니다.

5월 21일0

arXiv논문

SMoA: 매개변수 효율적 미세 조정을 위한 스펙트럼 변조 어댑터 (Spectrum Modulation Adapter)

SMoA(Spectrum Modulation Adapter)는 LoRA의 낮은 랭크로 인한 표현 능력 제한 문제를 해결하기 위해 제안된 새로운 매개변수 효율적 미세 조정(PEFT) 방식입니다. 레이어를 여러 스펙트럼 블록으로 분할하고 하다마르 변조 저차원 분기를 적용하여, 적은 매개변수만으로도 더 넓은 스펙트럼 방향을 확보할 수 있도록 설계되었습니다. 실험 결과, SMoA는 기존 LoRA 및 유사 베이스라인 대비 낮은 매개변수 예산 환경에서 평균적으로 더 높은 성능을 보여주었습니다.

5월 21일0

arXiv논문

추론 흔적 붕괴 (Reasoning-Trace Collapse): 미세 조정 (Fine-Tuning) 중 명시적 추론의 손실 평가

명시적 추론 모델을 미세 조정할 때, 추론 흔적이 없는 데이터로 학습하면 모델이 최종 답변은 잘 내놓더라도 내부 추론 과정을 상실하는 '추론 흔적 붕괴' 현상이 발생합니다. 연구팀은 이를 측정하기 위한 구조적 평가 프레임워크를 도입하여, 답변 성능 지표만으로는 이러한 성능 저하를 감지하기 어렵다는 점을 밝혀냈습니다. 또한, 교사 모델의 데이터 없이도 손실 마스킹(loss-masking) 전략을 통해 이 현상을 완화할 수 있음을 제안합니다.

5월 21일0

arXiv논문

생각하기 위한 증류, 행동하기 위한 예측: 자율 주행을 위한 인지-물리 강화학습 (CoPhy)

CoPhy는 자율 주행의 한계를 극복하기 위해 인지적 토대와 물리적 예측 환경을 결합한 강화학습 프레임워크입니다. VLM 지식을 BEV 인코더로 증류하여 추론 비용을 낮추고, 자기회귀 BEV 월드 모델을 통해 미래 상황을 예측하며, GRPO 기반의 이중 보상 메커니즘으로 안전성과 의도 준수성을 동시에 확보합니다.

5월 21일0

arXiv논문

Group Relative Policy Optimization에서의 Advantage Collapse: 진단 및 완화

GRPO 알고리즘에서 그룹 내 보상이 균질할 때 발생하는 Advantage Collapse(이득 붕괴) 현상을 진단하고 해결하는 방법을 다룹니다. 새로운 진단 지표인 ACR(Advantage Collapse Rate)을 도입하여 학습 정체를 예측하고, 이를 완화하기 위해 가상 보상 샘플을 주입하는 AVSPO 알고리즘을 제안합니다.

5월 21일0

arXiv논문

Linear-DPO: 확산(Diffusion) 및 흐름 매칭(Flow-Matching) 생성 모델을 위한 선형 직접 선호 최적화 (Linear

본 논문은 기존 DPO 방식이 텍스트-이미지 생성 모델의 흐름 매칭(Flow-matching)을 충분히 반영하지 못하고 목적 함수 불일치 문제를 겪는 점을 지적합니다. 이를 해결하기 위해 확산 및 흐름 매칭 모델을 모두 아우르는 통합 SDE 프레임워크를 기반으로, 시그모이드 대신 선형 유틸리티를 사용하는 Linear-DPO를 제안합니다. 실험 결과 SD1.5, SDXL, SD3-Medium 모델 모두에서 기존 방식보다 우수한 성능을 입증했습니다.

5월 21일0

arXiv논문

정신과 진단의 자동 ICD 분류: 전통적 NLP에서 대규모 언어 모델(LLM)까지

본 연구는 정신과 진단 텍스트를 국제 질병 분류(ICD) 코드로 자동 매핑하기 위해 다양한 NLP 및 ML 기술을 비교 평가했습니다. 실험 결과, Transformer 기반 임베딩 모델이 전통적인 방식보다 우수한 성능을 보였으며, 특히 e5_large 모델이 미세 조정을 통해 가장 높은 F1 점수를 기록했습니다.

5월 21일0

arXiv논문

구조화된 의료 데이터를 위한 Tabular Foundation Models 증류

Tabular Foundation Models(TFMs)의 높은 추론 비용과 인프라 요구 사항을 해결하기 위해 지식 증류(Knowledge Distillation)를 활용한 경량화 연구를 수행했습니다. 층화된 Out-of-fold 교사 라벨링 방식을 통해 컨텍스트 누수 문제를 해결하였으며, 실험 결과 학생 모델이 교사 모델 성능의 90% 이상을 유지하면서도 CPU 환경에서 최대 26배 빠른 속도를 기록했습니다.

5월 19일0

arXiv논문

적응형 경사 하강법(Adaptive Gradient Methods)은 헤비테일 노이즈(Heavy-Tailed Noise) 하에서 수렴할 수

본 연구는 헤비테일 경사 노이즈가 존재하는 비볼록 최적화 환경에서 적응형 경사 하강법의 수렴 가능성을 분석합니다. 특히 AdaGrad가 테일 지수 $p$에 대한 사전 지식 없이도 $4/3 < p ext{ } ext{leq} ext{ } 2$ 범위에서 수렴함을 최초로 증명하였으며, AdaGrad-Norm의 개선된 수렴 속도 또한 제시합니다.

5월 19일1

arXiv논문

확장을 넘어: 에이전트는 엣지(Edge)로 향하고 있다

본 포지션 페이퍼는 유용한 에이전트 지능을 구현하기 위해 개인용 에이전트 아키텍처가 클라우드에서 엣지(Edge)로 이동해야 한다고 주장합니다. 에이전트가 로컬 컨텍스트와 결합하고 제로 레이턴시를 유지하며 실시간 상호작용을 통해 학습하기 위해서는 물리적 환경과 가까운 엣지 기반의 실행 제어가 필수적임을 강조합니다.

5월 19일1

arXiv논문

대규모 단백질 폴드 분류: 벤치마킹 및 사전 학습 (Protein Fold Classification at Scale: Benchmarking

단백질 폴드 분류를 위한 대규모 비중복 벤치마크인 TEDBench를 소개하고, 기존 모델들의 한계를 극복하기 위한 새로운 자기지도 학습 프레임워크인 MiAE를 제안합니다. MiAE는 높은 마스킹 비율과 SE(3)-불변 인코더를 사용하여 경량화된 구조로도 최신 베이스라인을 뛰어넘는 뛰어난 성능과 확장성을 보여줍니다.

5월 19일1

arXiv논문

중첩 상태의 표현 매니폴드(Representation Manifolds) 탐색

본 논문은 중첩 상태의 표현 매니폴드를 탐색하기 위한 지도 학습 방법론인 'Manifold Probe'를 제안합니다. 이 방법은 선형 회귀 프로브를 일반화하여 모델의 표현 공간 내에서 해석 가능한 특징 공간을 학습하며, Llama 2-7b 모델을 통해 시간 및 공간 개념을 선형적으로 나타내는 매니폴드를 성공적으로 발견했습니다.

5월 19일1

arXiv논문

연합 마팅게일 사후 샘플링 (Federated Martingale Posterior Sampling)

연합 베이지안 신경망에서 사전 분포 설정의 어려움을 해결하기 위해 마팅게일 사후 분포 개념을 도입한 FMP(Federated Martingale Posterior) 샘플링 기법을 제안합니다. 클라이언트가 소량의 데이터 임베딩을 업로드하면 서버가 중앙에서 예측 샘플러를 실행하는 일회성 병렬 프로토콜을 통해 데이터 공유 없이도 높은 성능을 구현합니다. 실험 결과, MNIST 및 CIFAR 데이터셋에서 중앙 집중식 방식과 유사한 성능과 기존 베이스라인 대비 우수한 교정(calibration) 성능을 입증했습니다.

5월 19일1

arXiv논문

자기지도 국소 학습 규칙이 고차원 데이터의 숨겨진 계층적 구조를 학습하는 방법

본 연구는 뇌가 고차원 감각 입력을 추상화하는 원리를 규명하기 위해, 인공 데이터셋인 Random Hierarchy Model(RHM)을 사용하여 생물학적으로 타당한 국소 학습 규칙의 효용성을 조사했습니다. 연구 결과, 직접적인 피드백 신호를 사용하는 방식은 입력 특이적 비선형성 구현 실패로 인해 계층적 구조 학습에 한계를 보였습니다. 반면, 층별 자기지도 대조 또는 비대조 손실 함수를 사용하는 방식은 역전파만큼 효율적이면서도 피질의 시냅스 가소성 규칙과 호환되며 계층적 구조를 성공적으로 학습함을 입증했습니다.

5월 19일1

arXiv논문

scHelix: 명시적 유전자 수준 얽힘 해제를 통한 비대칭 이중 스트림 통합

scHelix는 단일 세포 RNA 시퀀싱(scRNA-seq) 데이터 통합 시 발생하는 배치 효과 제거와 생물학적 신호 보존 사이의 상충 관계를 해결하기 위한 새로운 프레임워크입니다. 유전자를 도메인 불변 앵커와 도메인 민감 변이체로 명시적으로 분리하여 처리하는 비대칭 이중 스트림 구조를 통해 과도한 교정을 방지합니다. Align-Refine-Fuse 프로토콜을 사용하여 생물학적 클러스터의 무결성을 유지하면서도 강력한 배치 효과 제거 성능을 보여줍니다.

5월 19일1

arXiv논문

S2Aligner: 희소 텍스트 속성 그래프를 위한 쌍 효율적 및 전이 가능한 사전 학습

S2Aligner는 텍스트 정보가 부족하거나 노이즈가 있는 희소한 텍스트 속성 그래프(TAGs)를 위해 제안된 새로운 사전 학습 프레임워크입니다. 의미론적 정렬과 구조적 모델링을 분리하여 텍스트의 희소성 문제를 해결하고, 교차 도메인 리스크 균형을 통해 도메인 간 전이 성능을 극대화합니다.

5월 19일0

arXiv논문

결과가 올바르게 보이지만 규율이 실패할 때: 숨겨진 경쟁자 상태 하에서의 Trace 기반 평가

결과 중심의 평가 방식이 에이전트의 행동 규율 위반을 감지하지 못하는 문제를 지적하며, 새로운 'Trace 기반 평가' 패러다임을 제안합니다. 호텔 가격 책정 및 예산 입찰 환경 실험을 통해, 보상 중심의 학습이 비즈니스 KPI는 달성하더라도 숨겨진 경쟁자 상태에 대응하는 행동 규율을 놓칠 수 있음을 증명했습니다.

5월 19일0

arXiv논문

PACE: 단일 세포 궤적 추론을 위한 기하학 인지 브리지 수송 (Geometry-Aware Bridge Transport)

PACE는 파괴적인 시계열 스냅샷으로부터 단일 세포의 연속적인 궤적을 추론하기 위한 새로운 프레임워크입니다. 비등방성 리만 메트릭과 신경망 브리지를 활용하여 세포 간의 비동기적 발달 문제를 해결하고, 기하학적으로 일관된 연속 시간 속도장을 복구합니다. 실험 결과, 기존 베이스라인 대비 재구성 성능을 크게 향상시켰으며 RNA-velocity 정렬 능력도 입증되었습니다.

5월 19일0

이 피드 구독하기

RSSFeedly, Inoreader 등으로 구독

API/api/search?q=검색어

AIllms.txt로 AI 크롤링 가이드