Insights
AI가 자동으로 큐레이션·번역·정리하는 기술 동향 피드입니다.
arXiv cs.LG 2052건필터 해제
활성화 함수(Activation Functions) 기반의 가중 최소 제곱법 (WLS) GNSS 측위를 위한 머신러닝 프레임워크
도심 지역의 신호 차단 및 다중 경로 효과로 인한 GNSS 측위 오차를 줄이기 위해 활성화 함수를 통합한 머신러닝 기반 WLS 프레임워크를 제안합니다. 앙상블 학습을 통해 신호 품질 점수를 예측하고, 이를 시그모이드 함수와 같은 활성화 함수를 통해 WLS 가중치로 변환하여 측위 정확도를 높입니다. 실험 결과, 제안된 방식은 다양한 도시 환경에서 높은 정확도와 지리적 전이성을 입증했습니다.
DelTA: 검증 가능한 보상을 이용한 강화학습을 위한 판별적 토큰 크레딧 할당
본 연구는 RLVR(검증 가능한 보상을 이용한 강화학습) 과정에서 응답 수준의 보상이 토큰 수준의 확률 변화로 전환되는 메커니즘을 판별적 관점에서 분석합니다. 기존 방식이 고빈도 패턴에 의해 학습 방향이 희석되는 문제를 해결하기 위해, 토큰 계수를 추정하여 판별력을 높이는 DelTA 방법론을 제안합니다. 실험 결과, DelTA는 Qwen3 모델 시리즈를 포함한 다양한 벤치마크에서 기존 베이스라인 모델들을 유의미하게 능가하는 성능을 보였습니다.
최소한의 RLVR 학습만으로 충분합니다: Rank-1 궤적을 통한 LLM의 외삽 (Extrapolation)
본 연구는 RLVR(검증 가능한 보상을 이용한 강화학습) 과정에서 발생하는 LLM의 파라미터 변화가 매우 낮은 계수(low-rank)를 가지며 예측 가능하다는 점을 발견했습니다. 이를 바탕으로 제안된 RELEX 방법론은 짧은 학습 단계의 데이터만으로 미래의 체크포인트를 선형 회귀로 외삽하여, 전체 학습 시간의 15%만으로도 높은 성능을 달성합니다.
스키마 그래프를 수정하는 것이 필수적인가? 관계형 딥러닝 (Relational Deep Learning)을 위한 풀-레졸루션
관계형 딥러닝(RDL)에서 고정된 그래프 구조의 한계를 극복하기 위해, 테이블 역할을 학습 가능한 노드와 엣지로 모델링하는 FROG 프레임워크를 제안합니다. 이 프레임워크는 역할 기반 메시지 전달 메커니즘과 함수 종속성 제약 조건을 통해 그래프 구조와 GNN 표현을 공동 최적화하여 관계형 의미론을 효과적으로 보존합니다.
지연 시간 최적화를 위한 웹 에이전트 계획 및 스케줄링용 에이전트 JIT 컴파일
컴퓨터 사용 에이전트(CUA)의 높은 지연 시간과 오류 문제를 해결하기 위해 에이전트 적시 컴파일(Agent JIT Compilation) 방식을 제안합니다. 이 방식은 자연어 작업을 실행 가능한 코드로 직접 컴파일하여 LLM 호출을 줄이고, JIT-Planner와 JIT-Scheduler를 통해 실행 속도와 정확도를 획기적으로 향상시킵니다.
AiraXiv: 인간과 AI 과학자를 위한 AI 기반 오픈 액세스 플랫폼
AI 생성 연구 결과물의 급증으로 인한 기존 학술 출판 시스템의 확장성 문제를 해결하기 위해 새로운 오픈 액세스 플랫폼인 AiraXiv를 제안합니다. AiraXiv는 인간과 AI 과학자 모두를 위해 설계되었으며, 오픈 프리프린트와 AI 증강 리뷰, MCP 기반의 상호작용을 통해 지속적인 연구 반복을 지원합니다.
Velocityformer: 우주론적 속도 재구성을 위한 대칭성 붕괴 매칭 등변 그래프 트랜스포머 (Broken-Symmetry-Matched
Velocityformer는 우주론적 kSZ 효과 측정을 위해 은하 속도를 정밀하게 재구성하는 등변 그래프 트랜스포머 아키텍처입니다. 관측 데이터의 깨진 대칭성을 모델의 귀납적 편향에 반영하여, 기존 선형 이론 및 머신러닝 베이스라인 대비 성능을 크게 향상시켰습니다. 특히 적은 양의 시뮬레이션 데이터로도 높은 정확도를 달성하며 다양한 우주론적 매개변수에 대해 제로샷 일반화 능력을 보여줍니다.
EvoStruct: 단백질 언어 모델 적응을 통한 항체 CDR 설계를 위한 진화적 및 구조적 사전 지식의 결합
EvoStruct는 항체 CDR 설계 시 발생하는 어휘 붕괴 문제를 해결하기 위해 단백질 언어 모델(PLM)의 진화적 지식과 E(3)-등변 GNN의 구조적 맥락을 결합한 새로운 프레임워크입니다. 점진적인 PLM 해제와 R-Drop 정규화 기법을 통해 기존 GNN 방식의 한계를 극복하고, CHIMERA-Bench에서 서열 회복률과 아미노산 다양성을 획기적으로 향상시켰습니다.
평형 추론기 (Equilibrium Reasoners): 어트랙터 (Attractor) 학습을 통한 확장 가능한 추론
평형 추론기(Equilibrium Reasoners, EqR)는 잠재 상태를 반복적으로 업데이트하여 테스트 시간 연산량을 확장하는 새로운 추론 패러다임을 제안합니다. 이 모델은 작업 조건부 어트랙터(Task-conditioned attractors)를 학습함으로써 외부 검증기 없이도 안정적인 고정점으로 수렴하여 문제를 해결합니다. 이를 통해 Sudoku-Extreme과 같은 고난도 작업에서 피드포워드 모델 대비 압도적인 정확도 향상을 입증했습니다.
CAdam: 생성적 증류 (Generative Distillation) 내 3D Gaussian 밀도화 (Densification)를 위한
생성적 증류(Generative Distillation) 기반의 3D Gaussian Splatting에서 발생하는 과도한 밀도화 문제를 해결하기 위한 새로운 프레임워크 CAdam을 제안합니다. CAdam은 그래디언트의 1차 모멘트와 간섭 원리를 활용하여 노이즈를 상쇄하고 기하학적 신호만을 효과적으로 추출합니다. 이를 통해 지각 품질을 유지하면서도 Gaussian 프리미티브의 개수를 최대 97%까지 획기적으로 감소시켜 메모리 효율성을 극대화합니다.
PlanningBench: 대규모 언어 모델(LLMs)의 평가 및 학습을 위한 확장 가능하고 검증 가능한 플래닝 데이터 생성
PlanningBench는 LLM의 플래닝 능력을 평가하고 학습시키기 위해 설계된 확장 가능하고 검증 가능한 데이터 생성 프레임워크입니다. 기존의 고정된 벤치마크와 달리, 구조화된 분류 체계를 통해 다양한 난이도와 제약 조건을 가진 플래닝 문제를 합성하고 자동 검증할 수 있습니다. 연구 결과, PlanningBench 데이터를 활용한 강화학습이 모델의 플래닝 및 지시 이행 능력을 유의미하게 향상시킴을 확인했습니다.
CIG: 조건부 정보 이득 (Conditional Information Gain)을 통한 탐색
강화학습의 탐색 효율을 높이기 위해 기존의 평생 보상과 에피소드 보상의 한계를 극복한 조건부 정보 이득(CIG) 보상을 제안합니다. CIG는 앙상블 불일치 커널의 로그-행렬식 목적 함수를 활용하여 고차원 상태 공간에서도 확장 가능한 인과적 단계별 보상을 생성합니다. 실험 결과, CIG는 확률적 방해 요소가 존재하는 환경에서도 기존 방법론보다 견고하고 뛰어난 성능을 입증했습니다.
NeighborDiv: 이웃 다양성(Neighbor Diversity)을 통한 학습이 필요 없는 제로샷 범용 그래프 이상 탐지
NeighborDiv는 기존의 노드-대-이웃 일관성 방식에서 벗어나 이웃 간의 다양성을 활용하는 학습이 필요 없는(training-free) 범용 그래프 이상 탐지 프레임워크입니다. 이웃 간 특징 유사도의 분산을 통해 이상 신호를 포착하며, 별도의 학습 없이도 다양한 도메인에서 높은 성능과 안정성을 보여줍니다.
최적 운송 (Optimal Transport)을 통한 개별 기하학적 구조 전반의 fMRI 활성화 사전 학습
본 연구는 개인별 뇌 기하학적 구조의 차이로 인해 발생하는 정보 손실 문제를 해결하기 위해 최적 운송(Optimal Transport) 기반의 새로운 fMRI 사전 학습 방식을 제안합니다. Fused Gromov-Wasserstein(FGW) 거리를 활용하여 서로 다른 그래프 구조를 비교하며, 분할 최적화(Amortized optimization)를 통해 대규모 데이터 계산 비용을 효율적으로 절감했습니다. 실험 결과, 제안된 방식은 개인의 고유한 기하학적 가변성을 보존하면서도 해석 가능한 표현을 생성함을 입증했습니다.
현명하고 프라이빗하게 선택하기: 공정하고 효율적인 연합 학습 (Federated Learning)을 위한 선제적 클라이언트 선택
본 논문은 데이터 전송 없이 분산 데이터를 활용하는 연합 학습(Federated Learning)의 비효율성을 개선하기 위해 선제적 클라이언트 선택 프레임워크를 제안합니다. 기존 방식들은 노이즈가 많거나 이질적인 클라이언트의 계산 자원 낭비와 통신 라운드 증가 등의 문제를 안고 있었습니다. 제안된 방법은 상호 정보량과 잠재적 연합 손실(PFL)을 사용하여 유용성과 공정성을 동시에 극대화하는 최적의 클라이언트 집합을 사전에 선택합니다.
훈련 분포가 약물 정보가 없는 암 민감도 예측의 한계를 결정한다
약물 정보가 없는 암 민감도 예측의 정체가 약물 표현법의 한계가 아닌, 기존 평가 지표의 오류(metric artifact)에서 비롯됨을 밝혀냈습니다. 연구 결과, 표준 지표인 전역 피어슨 상관계수는 약물 간 효능 차이에 왜곡되어 있으며, 기전 계층화 훈련(Mechanism-stratified training)을 통해 경로 특이적 신호를 회복함으로써 예측 성능을 실질적으로 향상할 수 있습니다.
Microsoft Security Copilot를 활용한 생성형 AI (GenAI) 기반 위협 탐지
Microsoft는 보안 분석가의 수동적인 대응을 보완하기 위해 상시 가동형 적응형 에이전트인 Dynamic Threat Detection Agent(DTDA)를 소개했습니다. DTDA는 통합 타임라인, 프롬프트 계약, 플래너-실행자 조사 루프를 결합하여 숨겨진 위협을 탐지하고 설명 가능한 경고를 생성합니다. 실제 배포 결과, 높은 정밀도와 함께 기존 모델 대비 향상된 탐지 성능을 입증하며 자율 에이전트의 실무 적용 가능성을 보여주었습니다.
얼마나 오래 공격해야 할까? 격투 게임에서의 행동 지속 시간 (Action Duration) 학습
격투 게임 강화학습 에이전트가 행동의 종류뿐만 아니라 실행 지속 시간(duration)을 함께 학습하는 새로운 의사결정 프레임워크를 제안합니다. 고정된 프레임 간격 대신 동적인 타이밍 조절을 통해 반응성을 최적화하고자 하며, FightLadder 환경을 통해 실험을 진행했습니다. 실험 결과, 에이전트는 특정 상황에서 낮은 반응성을 유지하며 스크립트 기반 봇의 취약점을 공략하는 전략을 학습하는 경향을 보였습니다.
교정(Calibration) 대 의사결정: 언러닝된 언어 모델의 신뢰성 역설 재고
머신 언러닝 과정에서 모델의 교정(Calibration) 상태가 양호하더라도, 모델이 가짜 상관관계에 의존하는 '신뢰성 역설'이 발생할 수 있음을 분석한 연구입니다. TOFU 벤치마크를 통해 언러닝 후 모델이 낮은 교정 오차를 유지하면서도 기여도 분석상으로는 지름길(shortcut) 기반의 의사결정에 의존하게 된다는 사실을 입증했습니다.
Sutra: 벡터 기호 아키텍처 (Vector Symbolic Architectures)를 위한 컴파일 타겟으로서의 Tensor-Op RNN
Sutra는 벡터 기호 아키텍처(VSA)를 위한 컴파일 타겟으로서, 타입 지정된 순수 함수형 프로그래밍 언어를 PyTorch 텐서 연산 그래프로 변환하는 시스템입니다. 이 시스템은 논리 프로그램과 학습 가능한 신경망의 경계를 허물어, 학습된 가중치를 소스 코드에 다시 기록함으로써 재컴파일 가능한 형태의 논리 프로그램을 생성합니다. 실험을 통해 다양한 임베딩 기질에서의 정확도와 PyTorch autograd를 통한 학습 가능성을 입증했습니다.
이 피드 구독하기
본 페이지의 콘텐츠는 AI가 공개된 소스를 기반으로 자동 수집·요약·번역한 것입니다. 원 저작권은 각 원저작자에게 있으며, 각 게시물의 “원문 바로가기” 링크를 통해 원문을 확인할 수 있습니다. 저작권자의 삭제 요청이 있을 경우 신속히 조치합니다.