Insights

AI가 자동으로 큐레이션·번역·정리하는 기술 동향 피드입니다.

Critic을 잊지 마세요: 다중 주기적 연속 강화학습 (Multi-Cyclic Continual Reinforcement Learning)을

연속 강화학습(CRL)에서 발생하는 치명적 망각을 해결하기 위해 Critic 정규화를 활용한 새로운 데이터 리허설 방식을 제안합니다. 다중 주기적 환경에서 Q-값 정규화를 사용하는 Qreg+NWLU 기법을 통해 학습 효율성과 지식 전이 성능을 개선했습니다.

5월 22일0

arXiv논문

Steins;Gate Drive: 지연 시간 분리형 LLM 계획을 위한 구조화된 미래에 대한 의미론적 안전 중재

LLM의 추론 지연 시간 문제를 해결하기 위해 플래너와 런타임을 분리한 Steins;Gate Drive 아키텍처를 제안합니다. LLM이 반사실적 주행 미래를 미리 선택하고 런타임이 이를 안전 계약 범위 내에서 재사용함으로써 지연 시간을 획기적으로 단축합니다.

5월 22일0

arXiv논문

이산적인 것을 연속적으로 만들기: 저조도 환경에서의 정밀한 사람 탐지 성능 평가를 위한 합성 RAW 증강 (Synthetic RAW

저조도 환경에서 객체 탐지 모델의 성능을 정밀하게 평가하기 위해 합성 RAW 이미지 증강 기술을 제안합니다. 카메라 센서의 노이즈 모델을 반영한 합성 데이터를 통해 데이터 불균형 문제를 해결하고 벤치마크의 커버리지를 개선합니다.

5월 22일0

arXiv논문

그래프 신경망 (GNN) 내 미니 배치 학습의 암묵적 규제화 (Implicit Regularization)

GNN 미니 배치 학습 시 무작위 노드 샘플링(RNS)이 구조 인식형 샘플러만큼 효과적임을 입증했습니다. RNS는 샘플링 과정에서 발생하는 그래디언트 분산을 통해 암묵적 규제화 효과를 제공하며, 성능과 효율성을 동시에 확보합니다.

5월 22일0

arXiv논문

KAPPS: 순환형 공장을 위한 지식 기반 CPPS 아키텍처

순환형 제조 환경의 불확실성을 해결하기 위해 온톨로지 기반 지식 그래프를 활용한 KAPPS 아키텍처를 제안합니다. 이 시스템은 이질적인 데이터 통합, 추론, 이벤트 기반 계획을 통해 인간과 기계의 지식을 통합하고 공정의 동적 적응을 지원합니다.

5월 22일0

arXiv논문

상관관계에서 인과관계로: Transformer 언어 모델의 특징 분석을 위한 5단계 방법론

Transformer 언어 모델의 인과적 특징을 분석하기 위한 5단계 방법론을 제안합니다. GPT-2 small 모델을 통해 활성화 패칭과 Sparse Autoencoder(SAE)를 활용한 회로 복구 및 인과적 검증 과정을 입증했습니다.

5월 22일0

arXiv논문

BioFormer: 생체 의학 시계열 데이터의 스펙트럼 구조 정렬을 통한 피험자 간 일반화 재고

BioFormer는 생체 의학 시계열 데이터의 피험자 간 일반화 문제를 해결하기 위해 스펙트럼 드리프트를 명시적으로 모델링하는 새로운 연구입니다. 주파수 대역 정렬 모듈(FBAM)을 통해 피험자 특이적 변동성을 완화하고 신호의 고유한 통계치를 활용하여 안정적인 표현을 학습합니다.

5월 22일0

arXiv논문

Search-E1: 자기 증류(Self-Distillation)를 통한 검색 증강 추론(Search-Augmented Reasoning)의

Search-E1은 복잡한 외부 모듈 없이 순수 GRPO만을 활용하여 검색 증강 추론 에이전트를 스스로 개선하는 자기 증류(Self-Distillation) 방법론을 제안합니다. 토큰 수준의 KL 목적 함수를 통해 정책의 추론 분포를 최적화하며, 기존 오픈 소스 베이스라인을 능가하는 성능을 입증했습니다.

5월 22일0

arXiv논문

불확실한 비선형 시스템의 참조 추적을 위한 신속한 적응을 위한 메타 학습 (Meta-Learning)

불확실한 비선형 시스템의 참조 추적을 위해 제한된 데이터로도 빠르게 적응할 수 있는 메타 학습 기반 제어 프레임워크를 제안합니다. iMAML 알고리즘을 활용하여 소스 시스템의 동역학을 학습하고, 대상 시스템에서 효율적인 미세 조정을 수행합니다.

5월 22일0

arXiv논문

우선순위 순위 매기기(Priority Ranking)를 통한 하네스 최적화 도구(Harness Optimizers)의 직접 평가를 향하여

하네스 최적화 도구의 성능을 간접적인 결과가 아닌 단계별 행동으로 직접 평가하기 위한 '우선순위 순위 매기기(Priority Ranking)' 방법론을 제안합니다. 이 방식은 비용 효율적으로 최적화 도구의 능력을 정량화하며, 실제 에이전트 개선 능력과 높은 상관관계를 보입니다.

5월 22일0

arXiv논문

Action-Chunking Behavioral Cloning에서의 멀티모달 실패 이해

동일한 관측치에서 여러 유효한 행동이 발생하는 멀티모달 상황에서 Action-Chunking 정책의 실패 원인을 분석합니다. 잠재 변수 정책의 정규화 문제와 행동 공간 생성 정책의 매끄러움 제한 문제를 심도 있게 다룹니다.

5월 22일0

arXiv논문

뉴럴 컴파일러 (The Neural Compiler): 하이브리드 과학적 머신러닝 (Scientific Machine Learning)을 위한

뉴럴 컴파일러는 물리 법칙을 포함한 과학적 머신러닝을 위해 기호적 명세를 미분 가능한 PyTorch 모듈로 변환하는 시스템입니다. 수동 코딩 없이도 물리 법칙을 정확하게 인코딩하며, 기존 PINN 방식보다 훨씬 적은 파라미터로 높은 정확도를 달 수 있습니다.

5월 22일0

arXiv논문

LACO: 협력 주행을 위한 적응형 잠재 통신 (Adaptive Latent Communication)

협력 주행 시 발생하는 언어 기반 통신의 지연 시간과 정보 손실 문제를 해결하기 위한 LACO 프레임워크를 제안합니다. 잠재 상태를 직접 융합할 때 발생하는 에이전트 정체성 혼란을 방지하며, 학습이 필요 없는 방식으로 효율적인 잠재 통신을 구현합니다.

5월 22일0

arXiv논문

에이전트 워크플로우를 LLM 가중치로 컴파일하기: 2단계 낮은 비용으로 최첨단(Near-Frontier) 품질 달성

기존의 외부 오케스트레이터 방식 대신 에이전트 워크플로우를 소규모 모델의 가중치로 직접 컴파일하는 '지하 에이전트' 기술을 제안합니다. 이를 통해 컨텍스트 소모와 비용 문제를 해결하고 최첨단 모델에 근접한 성능을 달성할 수 있음을 입증합니다.

5월 22일0

arXiv논문

BeLink: 생성적 재순위화(Generative Re-Ranking)를 결합한 생물 의학 개체 연결 (Biomedical Entity

BeLink는 생물 의학 개체 연결(BEL)의 효율성과 정확도를 높이기 위해 생성적 재순위화 기술을 도입한 연구입니다. 집합적 지시어 튜닝을 통해 추론 시간을 단축하면서도 연결 정확도를 최대 24% 향상시킨 모듈형 시스템을 제안합니다.

5월 22일0

arXiv논문

Marcus의 대수적 마음을 구축하는 방법: Galois Field 상의 대수적-결정론적 기질 (Algebro-Deterministic

Gary Marcus의 인지 아키텍처 이론을 구현하기 위해 GF(2) 상의 초차원 컴퓨팅(Hyperdimensional Computing) 아키텍처인 PyVaCoAl/VaCoAl을 제안합니다. 이 모델은 가역적 변수 결합과 비가환적 구성적 번들링을 통해 변수 연산, 재귀적 구조, 개별자/종류 구분을 지원합니다.

5월 21일0

arXiv논문

얼마만큼의 온라인 RL이 충분한가? RLVR에서의 오프라인 선호도 최적화(Offline Preference Optimization)를 위한

GRPO의 높은 계산 비용 문제를 해결하기 위해 짧은 온라인 웜업 후 DPO를 수행하는 G2D 파이프라인을 제안합니다. 실험 결과, 적절한 웜업을 거친 오프라인 DPO가 GRPO보다 훨씬 낮은 비용으로 대등하거나 더 높은 추론 성능을 보였습니다.

5월 21일0

arXiv논문

안개 속에서 길을 잃다: 센서 섭동(Perturbations)을 통한 주행 VLA의 추론 취약성 노출

자율 주행 VLA 모델의 센서 섭동에 따른 강건성을 연구한 논문입니다. 가우시안 노이즈, 조명, 안개 등 8가지 환경 변화를 통해 Alpamayo R1 모델을 평가하였으며, 추론 일관성이 궤적 신뢰성의 핵심 지표임을 입증했습니다.

5월 21일0

arXiv논문

Diffusion Teacher를 이용한 기댓값의 분산 감소

사전 학습된 확산 모델을 활용하는 다운스트림 파이프라인에서 발생하는 높은 계산 비용과 그래디언트 분산 문제를 해결하기 위한 CARV 프레임워크를 제안합니다. CARV는 계층적 몬테카를로 추정량을 통해 비용이 많이 드는 상위 작업을 저렴한 노이즈 재샘플링으로 분할 상환하여 계산 효율을 높입니다.

5월 21일0

arXiv논문

SURGE: 상호작용 구조를 포함한 이벤트 중심 소셜 미디어 감성 시계열 벤치마크

SURGE는 소셜 미디어 이벤트의 시계열적 변화와 게시물 간의 상호작용 구조를 결합한 새로운 멀티 이벤트 벤치마크입니다. 5개 카테고리, 67개 이벤트, 80만 개 이상의 게시물을 포함하며, 텍스트와 구조적 데이터를 통해 집단적 역학을 예측하는 연구를 지원합니다. 실험 결과, 기존 모델들이 이벤트 중심 데이터의 국소 지속성과 높은 상호작용 밀도 구간에서 어려움을 겪음을 확인했습니다.

5월 21일0

이 피드 구독하기

RSSFeedly, Inoreader 등으로 구독

API/api/search?q=검색어

AIllms.txt로 AI 크롤링 가이드