Insights
AI가 자동으로 큐레이션·번역·정리하는 기술 동향 피드입니다.
arXiv cs.LG 1910건필터 해제
GraphDETR을 이용한 엔드투엔드 (End-to-End) 서브그래프 탐지
GraphDETR은 서브그래프 탐지 문제를 집합 예측 문제로 공식화한 새로운 딥러닝 프레임워크입니다. GNN과 트랜스포머 디코더를 결합하여 단 한 번의 순전파로 다양한 패턴을 엔드투엔드로 탐지하며, 근사 매칭을 통해 확장성을 확보했습니다.
Conformal Risk Sharing: 참여 보장을 갖춘 인증된 비용 할당
부정적 사건의 재정적 영향을 그룹 내에서 공유할 때, 참여자의 이탈을 방지하기 위해 의무 상한선을 보장하는 Conformal Risk Sharing 프레임워크를 제안합니다. 분포 가정 없이 데이터로부터 신뢰할 수 있는 비용 할당 규칙과 에이전트별 보증을 생성하는 것이 핵심입니다.
우측 검열된 생존 데이터(Right-Censored Survival Data)를 위한 적절한 점수 규칙(Proper Scoring Rules)
우측 검열된 생존 데이터의 확률적 예측을 평가하기 위한 새로운 적절한 점수 규칙(Proper Scoring Rules) 프레임워크를 제안합니다. 검열 메커니즘을 통해 예측 분포를 매핑하는 방식을 통해 CRPS, Brier score 등의 검열 버전을 생성하며, 이론적 엄밀함을 입증했습니다.
Post-GCN 시대의 재고: 관계 학습 (Relational Learning)의 곡률 계층화 평가
관계 학습 모델 평가 시 데이터의 기하학적 구조를 무시한 평균 성능 지표가 편향을 유발함을 지적합니다. 데이터셋을 곡률(Curvature)에 따라 계층화하여 평가하는 새로운 프레임워크를 제안하고 18개 모델을 검증했습니다.
영상의학에서의 비교 추론을 위한 시각-언어 프레임워크
영상의학의 비교 진단 실무를 지원하기 위해 엔티티 인식 교차 이미지 추론 프레임워크를 제안합니다. 대규모 데이터셋 MedReCo-DB를 구축하고, 검색을 위한 MedReCo와 생성적 해석을 위한 MedReCo-VLM 모델을 개발하여 성능을 입증했습니다.
에이전트 기반 데이터 분석을 위한 비지도 기술 발견 (Unsupervised Skill Discovery)
DataCOPE는 라벨 없이도 데이터 분석 에이전트가 재사용 가능한 기술을 스스로 발견할 수 있게 하는 비지도 학습 프레임워크입니다. 검증기 신호를 활용해 탐색 궤적의 품질을 평가하며, 보고서 작성 및 추론 스타일 분석에서 성능을 크게 향상시킵니다.
정규화 흐름(Normalizing Flows)을 이용한 잠재적 추론(Latent Reasoning)
NF-CoT는 텍스트 기반의 이산적인 사고 사슬(CoT) 대신 정규화 흐름(Normalizing Flows)을 사용하여 연속적인 잠재적 추론을 수행하는 프레임워크입니다. 기존 잠재적 추론 방식과 달리 확률적 샘플링과 KV-캐시 호환성을 유지하며, 코드 생성 성능을 높이고 추론 비용을 절감합니다.
이중 사전 조건화 (Double Preconditioning, DoPr): 검증 손실 (Validation Loss)이 아닌 테스트 시간 성능
학습 시의 검증 손실과 실제 테스트 시간 성능 사이의 불일치 문제를 해결하기 위한 새로운 최적화 패러다임인 DoPr을 제안합니다. DoPr은 그래디언트 단위와 활성화 단위 사전 조건화를 결합하여 오차 누적을 완화하고 다운스트림 성능을 향상시킵니다.
엔트로피 추론을 통한 인과적 아틀라스: 최적의 DAG를 넘어선 베이지안 네트워크
본 논문은 기존 베이지안 네트워크의 최적화 방식이 가진 한계를 지적하며, 엔트로피 기반 추론을 통해 데이터에 충실한 인과 관계 아틀라스를 구축하는 방법을 제안합니다. 단일 DAG 대신 최대 엔트로피 그래프 앙상블을 사용하여 데이터의 구조적 모호성을 정량화하고 보다 정확한 인과 지도를 생성합니다.
인컨텍스트 다중 인스턴스 학습 (In-Context Multiple Instance Learning)
본 연구는 저라벨 환경의 다중 인스턴스 학습(MIL) 문제를 해결하기 위해 Perceiver 스타일의 인컨텍스트 학습기를 제안합니다. 합성 데이터로 사전 학습된 이 모델은 그래디언트 업데이트 없이 단 한 번의 순전파만으로 새로운 과제를 수행하며, 12개 벤치마크에서 기존 지도 학습 모델을 능가하는 성능을 보였습니다.
AI-RAN의 파라미터-KPI 의존성 학습을 위한 이벤트 탐지
AI-RAN 및 O-RAN 환경에서 제어 파라미터와 네트워크 KPI 간의 의존성을 학습하기 위한 이벤트 탐지 방법론을 제안합니다. 노이즈가 포함된 연속 텔레메트리 데이터에서 실제 제어 상호작용을 배경 변동과 구분하여 포착하는 데 중점을 둡니다.
You Only Index Once: 공유 라우팅을 통한 교차 레이어 희소 어텐션 (Cross-Layer Sparse Attention)
긴 문맥 추론 시 발생하는 디코딩 효율성 문제를 해결하기 위해 교차 레이어 희소 어텐션(CLSA)을 제안합니다. 단일 인덱서가 계산한 라우팅 인덱스를 레이어 간 공유함으로써 오버헤드를 줄이고 토큰 희소 어텐션의 정확도를 유지합니다.
좋은 보간기(Interpolators)는 얼마나 풍부한가?
선형 분류 모델의 보간(interpolation) 성능과 일반화 오차 사이의 관계를 대편차 원리를 통해 분석한 연구입니다. 가우시안 혼합 모델과 로지스틱 모델 환경에서 보간 분류기들의 일반화 성능이 특정 값으로 집중되는 현상을 수학적으로 입증했습니다.
PC Layer: LLM 사전 학습 개선을 위한 다항식 가중치 프리컨디셔닝 (Polynomial Weight Preconditioning)
LLM 사전 학습의 안정성을 높이기 위해 가중치 행렬의 특이값 스펙트럼을 재형성하는 PC 레이어를 제안합니다. 저차 다항식 프리컨디셔닝을 사용하여 추론 오버헤드 없이 학습 효율을 개선하며, Llama-1B 모델 실험을 통해 성능 우위를 입증했습니다.
확산 언어 모델을 위한 자기 증강 검색 (Self-Augmenting Retrieval for Diffusion Language Models)
이산 확산 언어 모델의 디노이징 과정에서 발생하는 저확신 토큰을 활용하여 검색을 수행하는 SARDI 프레임워크를 제안합니다. 별도의 학습 없이도 디노이징 궤적의 초기 신호를 통해 강력한 증거를 검색함으로써 성능과 처리량을 크게 향상시킵니다.
RREDCoT: 추론 모델을 위한 세그먼트 수준의 보상 재분배
추론 언어 모델의 강화학습 과정에서 발생하는 지연된 보상 및 높은 분산 문제를 해결하기 위한 RREDCoT 방법론을 제안합니다. 추가적인 생성 없이 모델 자체를 활용하여 CoT 세그먼트에 최적의 보상을 재분배함으로써 신용 할당 문제를 개선합니다.
DNQ: 부분 관측 가능한 n-인 게임을 위한 심층 Nash Q-네트워크 (Deep Nash Q-Network)
부분 관측 가능한 n-인 게임 환경에서 입찰 에이전트를 훈련하기 위한 DNQ 프레임워크를 제안합니다. 공유 비평가를 활용한 쌍별 보상 추정 방식을 통해 계산 비용을 줄이면서도 전략적 평형을 학습할 수 있습니다.
재귀성 없이 순환 신경망(Recurrent Networks) 사전 학습하기
RNN의 고질적인 문제인 기울기 소실과 병렬성 제한을 해결하기 위한 지도 메모리 학습(SMT) 방법론을 제안합니다. SMT는 재귀적 크레딧 전파를 우회하여 RNN을 단일 단계 지도 학습으로 변환함으로써 시간 병렬적 학습과 안정적인 기울기 경로를 제공합니다.
다중 입도(Multi-Granularity) AI-텍스트 탐지를 위한 작업 가이드 기반 점진적 인간-AI 텍스트 변환 벤치마크
인간과 AI의 공동 편집 과정을 반영한 다중 입도 AI-텍스트 탐지 벤치마크인 OpAI-Bench를 소개합니다. 문서, 문장, 토큰 등 다양한 수준에서 AI 저자성 신호를 분석하며, 기존 벤치마크가 놓쳤던 비단조적 탐지 패턴을 규명합니다.
반복 게임에서 적응형 상대방을 고려한 후회 최소화 (Regret Minimization with Adaptive Opponents in
적응형 상대방이 존재하는 반복 게임에서 기존 외부 후회 지표의 한계를 극복하기 위해 RP-Regret 지표를 새롭게 제안합니다. 플레이어의 반사실적 추론을 반영하여 더 나은 균형을 찾을 수 있는 알고리즘과 이론적 조건을 연구합니다.
이 피드 구독하기
본 페이지의 콘텐츠는 AI가 공개된 소스를 기반으로 자동 수집·요약·번역한 것입니다. 원 저작권은 각 원저작자에게 있으며, 각 게시물의 “원문 바로가기” 링크를 통해 원문을 확인할 수 있습니다. 저작권자의 삭제 요청이 있을 경우 신속히 조치합니다.