© 2026 Molayo

Insights

AI가 자동으로 큐레이션·번역·정리하는 기술 동향 피드입니다.

arXiv cs.LG 2052건필터 해제

물리 기반 능동 학습 (Active Learning)을 통한 데이터 효율적인 신경 연산자 (Neural Operator) 학습

신경 연산자(Neural Operator)를 이용한 편미분 방정식(PDE) 풀이 시 발생하는 높은 데이터 요구량 문제를 해결하기 위해 물리 정보 기반의 능동 학습(Active Learning) 알고리즘을 제안합니다. PDE 잔차를 활용하여 정보 가치가 높은 샘플을 선택하는 '물리 기반 획득(Physics-based acquisition)' 방식을 통해 데이터 효율성을 극대화하고 모델의 물리적 이해도를 높였습니다.

Insights Generator: LLM 에이전트를 위한 체계적인 코퍼스 수준의 트레이스 진단

LLM 에이전트의 실패 원인을 수동으로 분석하는 한계를 극복하기 위해, 코퍼스 수준에서 체계적인 행동 패턴을 진단하는 멀티 에이전트 시스템인 Insights Generator(IG)를 제안합니다. IG는 스카우트-조사관(scout-investigator) 아키텍처를 통해 트레이스 전반의 가설을 제안하고 테스트하여 근거 있는 자연어 통찰 보고서를 생성합니다. 실험 결과, IG의 보고서를 활용한 전문가는 스캐폴드 성능을 30.4pp 향상시켰으며 코딩 에이전트의 성능 또한 일관되게 개선되었습니다.

AWA-CNN 프레임워크를 이용한 스위칭 전압 하에서의 단일 및 혼합 부분 방전 분류

본 연구는 고속 스위칭 전력 전자 기기 환경에서 발생하는 부분 방전(PD)을 효과적으로 분류하기 위해 진폭, 폭, 면적을 활용한 AWA(Amplitude-Width-Area) 패턴 표현법을 제안합니다. 시간 영역의 PD 펄스를 시각적 패턴으로 변환하여 6가지의 단일 및 혼합 PD 소스를 구분하며, CNN 모델을 통해 높은 분류 정확도를 입증했습니다.

실제-합성 데이터 공동 학습을 위한 폐쇄 루프 동적 주행 데이터 혼합 방식

자율 주행 엔드 투 엔드 학습을 위해 실제 데이터와 합성 데이터를 효율적으로 혼합하는 폐쇄 루프 데이터 엔진인 AutoScale을 제안합니다. AutoScale은 장면 표현, 데이터 혼합 최적화, 검색 과정을 통합하여 모델 성능을 극대화하도록 데이터 구성을 동적으로 조정합니다. 실험 결과, 기존 방식보다 적은 합성 데이터만으로도 NavSim 벤치마크에서 더 뛰어난 성능을 입증했습니다.

제어 가능한 이미지 복원을 위한 확률적 보간법(Stochastic Interpolants)에서의 생성과 회귀 분리

DiSI는 확률적 보간법(Stochastic Interpolants)을 생성과 회귀 구성 요소로 분리하여 이미지 복원의 효율성과 충실도를 동시에 해결하는 통합 프레임워크입니다. 이를 통해 단일 모델 내에서 왜곡-지각 트레이드오프를 조절하며, 고품질의 적은 단계 추론(few-step inference)을 가능하게 합니다.

PDE 유도 측도에 대한 1단계 Wasserstein 가이드 생성 모델의 정칙성 및 일반화에 관하여

본 논문은 PDE(편미분 방정식) 유도 확률 측도를 대상으로 하는 1단계 Wasserstein 가이드 생성 모델의 정칙성과 일반화 특성을 분석하는 이론적 프레임워크를 제안합니다. 선형 타원형, 포물선형 방정식 및 Fokker-Planck 방정식을 다루며, 최적 운송 맵의 횔더 연속성을 증명하여 1단계 생성 모델의 근사 이론적 정당성을 확보했습니다. 또한 DeepParticle 사례를 통해 초과 위험 경계와 타겟 시프트에 대한 강건성을 입증했습니다.

회복 탄력적이고 자율적인 네트워크를 향하여: AI-Native 6G에 대한 BlueSky 비전

본 논문은 6G 네트워크가 단순한 통신 수단을 넘어 AI가 네이티브하게 통합된 자율적이고 회복 탄력적인 인프라로 진화해야 한다는 BlueSky 비전을 제시합니다. 기존의 산재된 모델 방식에서 벗어나, 파운데이션 모델과 멀티 에이전트 시스템을 활용하여 네트워크 관리를 통합적인 멀티모달 및 멀티태스크 최적화 문제로 해결하는 로드맵을 제안합니다.

생성 모델에서의 암기, 수렴 및 일반화

본 연구는 생성 모델이 훈련 데이터를 단순히 암기하는지, 아니면 데이터 분포를 학습하여 일반화하는지를 분석합니다. 선형 생성 모델을 통해 데이터 샘플 수가 입력 차원에 비례할 때 수렴이 발생함을 밝혀냈으며, 데이터 분포의 일치(수렴)와 주요 잠재 요인의 복구는 서로 별개의 과정임을 입증했습니다.

12편의 LLM 에이전트 벤치마크 논문이 스스로에 대해 밝히는 것: 파일럿 감사 및 공개 점수 체계

본 연구는 12편의 LLM 에이전트 및 정적 벤치마크 논문을 대상으로 평가 과정의 정보 공개 수준을 분석한 파일럿 감사 보고서입니다. 연구 결과, 에이전트 벤치마크 논문들은 정적 벤치마크에 비해 추론 비용이나 평가 환경(harness specification)에 대한 정보 공개가 현저히 낮음을 확인했습니다. 연구진은 투명한 연구 생태계를 위해 감사 체계와 점수 코드북을 JSON, Markdown, CSV 형식으로 공개했습니다.

FedCritic: 6G 멀티셀 OFDMA를 위한 서버리스 연합 Critic 학습 기반 자원 할당

6G 초고밀도 네트워크의 셀 간 간섭 문제를 해결하기 위해 서버리스 연합 학습 기반의 자원 할당 프레임워크인 FedCritic을 제안합니다. FedCritic은 중앙 코디네이터 없이 가십 기반 파라미터 평균화를 통해 크리틱을 연합함으로써, 부반파 스케줄링과 전력 할당을 효율적으로 수행합니다. 시뮬레이션 결과, 기존 방식 대비 낮은 오버헤드로 네트워크 전체의 전송률과 공정성을 크게 개선함을 입증했습니다.

HiRes: 반응 조건 추천을 위한 검토 가능한 선례 메모리

HiRes는 화학 반응 조건 추천을 위해 검색 증강(Retrieval-Augmented) 방식을 도입한 새로운 모델입니다. 그래프 인코더와 k-NN 검색 레이어를 결합하여 높은 예측 정확도를 달성함과 동시에, 화학자가 검토할 수 있는 구체적인 선례(precedents)를 함께 제공하여 모델의 해석 가능성을 높였습니다.

효율적인 미세 조정(Fine-Tuning)을 위한 선호도 인지 영향 함수 기반 데이터 선택 방법

LLM 미세 조정 시 데이터 효율성을 높이기 위해 모델의 현재 선호도를 반영하여 데이터에 가중치를 부여하는 PRISM 방법론을 제안합니다. PRISM은 목표 동작과 현재 모델 간의 관련성을 고려하여 데이터 예산을 최적의 샘플에 집중시킴으로써 미세 조정 및 안전 지향적 SFT의 성능을 개선합니다.

적응형 신호 소생 (Adaptive Signal Resuscitation): 희소 비전 네트워크를 위한 채널별 사후 가지치기 복구

높은 희소성을 가진 비전 네트워크에서 발생하는 가지치기 후 정확도 저하 문제를 해결하기 위해, 채널별로 신호를 복구하는 '적응형 신호 소생(ASR)' 기법을 제안합니다. ASR은 레이어 단위의 보정 대신 채널 단위의 분산 매칭과 데이터 기반 수축 규칙을 사용하여, 재학습 없이도 손상된 채널의 신호를 효과적으로 복구합니다. 실험 결과, ResNet-50 모델의 90% 희소성 환경에서 기존 방식보다 월등히 높은 정확도 회복 성능을 입증했습니다.

가우시안 주변 분포 하에서의 다중 클래스 선형 분류를 위한 다항 시간 강건 학습

가우시안 주변 분포를 가진 다중 클래스 선형 분류기의 비가정적 학습(agnostic learning) 문제를 해결하기 위한 새로운 연구를 소개합니다. 기존 알고리즘이 가졌던 지수적 복잡도 문제를 극복하여, 차원에 독립적인 오차 보장을 제공하는 완전 다항 시간 강건 학습기를 설계했습니다. 특히 다중 클래스 퍼셉트론의 한계를 규명하고, 효율적인 쌍별 부적절 학습(pairwise improper-learning) 프레임워크를 제안합니다.

roto 2.0: 로봇 촉각 올림피아드

roto 2.0은 파편화된 촉각 기반 강화학습(RL) 연구를 표준화하기 위해 설계된 GPU 병렬화 벤치마크입니다. 고유 수용 감각과 촉각 센싱만을 사용하는 '맹목적(blind)' 조작에 집중하며, 기존 SOTA 대비 압도적인 성능 향상을 입증했습니다. 오픈 소스 환경과 베이스라인을 제공하여 연구자들이 알고리즘 자체에 집중할 수 있도록 돕습니다.

가우시안 층(Gaussian Sheaf) 신경망

전통적인 GNN의 메시지 전달 방식이 확률 분포 형태의 노드 특징을 처리할 때 발생하는 구조적 한계를 극복하기 위한 새로운 프레임워크인 가우시안 층 신경망(GSNNs)을 제안합니다. 셀룰러 층(cellular sheaves) 이론을 기반으로 가우시안 분포의 평균과 공분산이 가진 기하학적·대수적 구조를 보존하는 새로운 라플라시안 연산자를 도출하였습니다.

주간 지진 발생 예측을 위한 신경망 음이항 회귀: 셀별 분산 추정 및 꼬리 위험 평가

본 연구는 기존 포아송 분포 기반 지진 예측 모델의 한계를 극복하기 위해, 공간적 이질성을 반영한 EarthquakeNet 아키텍처를 제안합니다. 이 모델은 신경망을 통해 셀별 과분산 파라미터를 내생적으로 추정함으로써 지진 클러스터링을 효과적으로 식별하고 극단적 사건에 대한 예측 정확도를 높였습니다.

torchtune: PyTorch 네이티브 사후 학습 (post-training) 라이브러리

torchtune은 LLM의 사후 학습(post-training) 라이프사이클을 간소화하기 위해 설계된 PyTorch 네이티브 라이브러리입니다. 기존 프레임워크와 달리 모듈성, 해킹 가능성, PyTorch 구성 요소에 대한 직접적인 접근을 강조하며, 효율적인 미세 조정과 실험을 지원합니다. Axolotl 및 Unsloth와 비교했을 때 연구 반복을 위한 유연성과 강력한 성능 및 메모리 효율성을 동시에 제공합니다.

해석 가능한 루브릭 임베딩 (Rubric Embeddings)을 통한 레이블 편향 (Label Bias) 완화

과거의 인간 평가 데이터에 포함된 편향을 학습하는 문제를 해결하기 위해 '루브릭 임베딩(Rubric Embeddings)'이라는 새로운 표현 프레임워크를 제안합니다. 이 방식은 블랙박스 임베딩 대신 전문가가 정의한 의미론적 기준을 사용하여 예측을 수행함으로써 편향된 대리 신호로부터 모델을 보호합니다. 석사 과정 지원 데이터셋을 통한 실험 결과, 집단 간 격차를 줄이면서도 코호트 품질을 개선하는 효과를 입증했습니다.

Sim-to-Real Gap을 주의하고 과학자처럼 생각하라

시뮬레이터의 편향과 실제 실험의 비용 사이에서 최적의 의사결정을 내리기 위한 이론적 프레임워크를 제안합니다. 시뮬레이터의 가치 오차를 분석하고, 시뮬레이션 보조 실험 정책인 Fisher-SEP를 통해 타겟 정책의 사후 예측 분산을 최소화하는 방법을 다룹니다. 자판기 공급망 및 HIV 검사 사례를 통해 실험 시점과 설계된 탐색의 중요성을 입증합니다.

이 피드 구독하기

RSSFeedly, Inoreader 등으로 구독

API/api/search?q=검색어

AIllms.txt로 AI 크롤링 가이드

본 페이지의 콘텐츠는 AI가 공개된 소스를 기반으로 자동 수집·요약·번역한 것입니다. 원 저작권은 각 원저작자에게 있으며, 각 게시물의 “원문 바로가기” 링크를 통해 원문을 확인할 수 있습니다. 저작권자의 삭제 요청이 있을 경우 신속히 조치합니다.