© 2026 Molayo

Insights

AI가 자동으로 큐레이션·번역·정리하는 기술 동향 피드입니다.

arXiv cs.LG 2125건필터 해제

FORGE: 문맥 인식 분획 기반 순위 지정 및 생성을 통한 분자 최적화

FORGE는 문맥 인식 분획 기반 순위 지정 및 생성을 통해 분자 최적화를 수행하는 2단계 프레임워크입니다. 기존의 언어 모델 접근 방식이 가진 데이터 스케일링 병목 현상, 화학적 환각 문제, 그리고 분획 효과의 문맥 의존성 무시 등의 한계를 극복합니다. FORGE는 자동 추출된 저-고 편집 쌍을 활용하여 후보 분획 순위 지정(Stage 1)과 명시적인 분획 대체물 생성(Stage 2)을 수행하며, 소형 언어 모델 기반으로 다양한 화학적 목표에 대해 높은 성능을 입증했습니다.

강화학습에서 비균일 리플레이는 언제 중요한가?

본 논문은 오프폴리시 강화학습(RL)에서 단순한 균일 리플레이가 아닌 비균일 리플레이의 필요성과 효과를 분석합니다. 연구진은 비균일 리플레이의 유용성이 '리플레이 볼륨', '기대 최신성', 그리고 '샘플링 분포 엔트로피' 세 가지 요인에 의해 결정됨을 밝혀냈습니다. 그 결과, 낮은 리플레이 볼륨 환경에서 가장 효과적이며, 높은 엔트로피를 유지하면서도 계산 오버헤드가 적은 'Truncated Geometric replay'라는 새로운 샘플링 전략을 제안하고 검증했습니다.

시간적 상관관계의 이점: SGD가 랜덤 워크로부터 k-Juntas를 효율적으로 학습하는 방법

본 논문은 데이터의 시간적 상관관계를 활용하여 Boolean k-juntas와 같은 희소 학습 문제를 효율적으로 해결하는 방법을 제시합니다. 특히, 샘플이 초입방체 위에서의 게으른 랜덤 워크로 생성될 때, 시간차 손실(temporal-difference loss)을 사용하는 2층 ReLU 네트워크를 통해 모델을 훈련할 수 있습니다. 이 접근 방식은 표준 경사 기반 방법으로는 얻기 어려운 효율성을 보여주며, 결과적인 샘플 복잡도가 주변 차원 d에 선형적으로 비례함을 입증합니다.

MARGIN: 불균형 취약점 탐지를 위한 마진 인식 정규화 기하학

본 논문은 소프트웨어 취약점 탐지에서 발생하는 빈도 및 난이도 불균형 문제를 해결하기 위해 MARGIN이라는 메트릭 기반 프레임워크를 제안합니다. 이 프레임워크는 적응형 마진 학습과 초구 프로토타입 모델링을 결합하여, 임베딩 공간의 기하학적 왜곡을 정규화하는 것이 핵심입니다. MARGIN은 분포 구조에 따라 동적으로 기하학적 정규화를 조정함으로써, 취약점 표현의 안정적인 결정 경계를 구축하고 분류 및 탐지 성능을 크게 향상시킵니다.

E-TCAV: 효율적인 개념 기반 해석 가능성을 위한 마지막 근사치 공식화

E-TCAV는 기존의 해석 가능성 방법인 TCAV(Testing with Concept Activation Vectors)가 가진 계산 오버헤드, 레이어 간 불일치, 통계적 불안정성 등의 문제를 해결하기 위해 제안된 효율적인 근사화 프레임워크입니다. 이 연구는 잠재 분류기의 안정성 영향 분석, 레이어 간 일치성 검증, 그리고 마지막 근사치를 초기 레이어의 빠른 대리 변수로 활용하는 세 가지 핵심 측면을 기반으로 합니다. E-TCAV를 통해 네트워크 크기와 샘플 수에 대해 선형적으로 확장되는 속도 향상을 달성하여, 모델 디버깅 및 실시간 개념 기반 훈련에 기여합니다.

교모세포종(Glioblastoma)의 암 면역 시그니처 평가를 위한 예측 방사체학 (Predictive Radiomics):

본 연구는 방사유전체학(Radiogenomics) 접근 방식을 활용하여 IDH 야생형 교모세포종(Glioblastoma)의 미세환경 내 대식세포 아형 면역 시그니처를 예측하는 영상 의학적 바이오마커를 개발하고 검증했습니다. 다양한 다기관 데이터셋을 사용한 후향적 연구에서, 딥러닝 기반 특징 추출과 앙상블 모델링을 통해 높은 성능의 예측 모델이 구축되었습니다. 이 모델은 교모세포종 환자에게서 대식세포 아형 M0 면역 시그니처를 비침습적으로 예측할 수 있음을 보여주었으며, 향후 맞춤형 면역요법 개발에 중요한 기초 자료를 제공할 것으로 기대됩니다.

DeepLog: 모듈형 신경기호 AI를 위한 소프트웨어 프레임워크

DeepLog는 논리(logic)와 딥러닝을 PyTorch 환경 내에서 통합하는 범용 신경기호 AI 프레임워크입니다. 이 프레임워크는 다양한 신경기호 시스템들을 고수준 사양으로 받아 최적화된 산술 회로로 자동 컴파일합니다. 이를 통해 논리를 조합 가능한 모듈로 다루어, 머신러닝 실무자들의 접근성을 높이고 연구자들이 새로운 통합 전략을 쉽게 프로토타이핑할 수 있는 강력한 기반을 제공합니다.

LeapTS: 시계열 예측을 적응형 다중 호라이즌 스케줄링으로 재고찰하기

LeapTS는 시계열 예측을 고정된 매핑이 아닌 동적 스케줄링 프로세스로 재정의하는 새로운 프레임워크입니다. 이 모델은 계층적 컨트롤러와 신경 제어 미분 방정식을 결합하여, 각 단계에서 최적의 예측 규모 및 전진 길이를 동적으로 결정합니다. 광범위한 평가 결과, LeapTS는 기존 Transformer 기반 모델 대비 예측 성능을 크게 향상시키고 추론 속도를 개선하는 동시에, 비정상성 역학 포착 능력을 입증했습니다.

안전한 오프라인 강화학습을 위한 견고한 확률적 차폐 (Robust Probabilistic Shielding for Safe Offline

본 논문은 오프라인 강화학습(Offline RL)의 핵심 과제인 정책의 안전성 보장을 다룹니다. 기존의 안전 정책 개선(SPI) 기법을 확장하여, 주어진 데이터셋과 안전/위험 상태에 대한 지식만을 활용하는 '차폐된 SPI'를 제안합니다. 이 방법은 행동 공간을 증명 가능한 안전한 범위로 제한함으로써 높은 확률로 안전성을 보장하며, 실험적으로 차폐되지 않은 방식보다 성능 및 안정성 모두에서 우수함을 입증했습니다.

Qwen Goes Brrr: 우크라이나 다중 도메인 문서 이해를 위한 기성 RAG

본 기사는 우크라이나어 다중 도메인 문서 이해를 목표로 하는 UNLP 공유 과제에 참여하여 개발된 검색 증강 생성(RAG) 파이프라인을 소개합니다. 이 시스템은 컨텍스트 청킹, 질문 인식 밀집 검색, 그리고 질문과 답변 옵션을 모두 고려하는 재순위 지정 단계를 포함합니다. 특히, Qwen3-Embedding-8B와 미세 조정된 Qwen3-Reranker-8B를 사용하여 검색 및 순위를 개선하고, 이를 통해 높은 답변 정확도(최대 0.9674)와 리더보드 점수(비공개 0.9598)를 달성했습니다.

Follow the Mean: Reference-Guided Flow Matching

본 논문은 기존의 제어 가능한 생성 방식(파인튜닝, 보조 네트워크 등)의 한계를 극복하고, 플로우 매칭(Flow Matching)을 활용하여 참조 기반의 새로운 제어 방식을 제시합니다. 핵심 아이디어는 모델이 따르는 속도장(velocity field)을 조건부 종점 평균(conditional endpoint mean)을 조작함으로써 원하는 참조 세트(reference set)로 '조향'하는 것입니다. 이를 통해 추가적인 훈련 없이 색상, 스타일, 정체성 등 다양한 측면의 제어가 가능하며, 이는 생성 모델이 매개변수 업데이트가 아닌 데이터 기반으로 적응할 수 있음을 보여줍니다.

적대적 커널화된 밴딧을 위한 거의 최적 알고리즘

본 논문은 적대적 환경에서 커널화된 밴딧(kernelized bandits) 문제를 다루며, 특히 알려진 재생 커널 힐베르트 공간(RKHS) 내의 보상 함수가 매 라운드마다 적대적으로 선택될 수 있는 상황을 가정합니다. 연구진은 지수 가중치 알고리즘을 제안하여 $ ilde{O}(\sqrt{T \gamma_T})$의 적대적 후회(adversarial regret)를 달성함을 증명했습니다. 또한, 이 알고리즘이 다항로그 계수까지 최적임을 보장하는 하한 경계를 제시하고, 계산 효율성을 높인 변형도 제안합니다.

관계는 채널이다: Kraus 분해를 통한 지식 그래프 임베딩

본 논문은 지식 그래프 임베딩(KGE) 모델의 근본적인 구조를 이론적으로 재정립하며, 모든 관계 연산자가 만족해야 하는 세 가지 공리(선형성, 트레이스 보존, 완전 양수성)를 식별합니다. 이 공리들은 Kraus 표현 정리(Kraus representation theorem)에 의해 Kraus 채널 구조로 특성화됩니다. 이를 바탕으로, 기존 모델의 한계를 극복하고 $1$-to-$N$ 및 $N$-to-$N$ 관계 처리가 가능하며 명시적 경로 인코더가 필요 없는 $ ext{KrausKGE}$를 제안합니다.

암묵적 미분(Implicit Differentiation) 없이 고정점 신경망 최적 수송 (Fixed-Point Neural Optimal

본 논문은 기존의 적대적 최소-최대 최적화 및 다중 네트워크 구조를 제거하고, 단일 포텐셜을 매개변수화하여 고정점 신경망 최적 수송(Fixed-Point Neural Optimal Transport)을 공식화합니다. 핵심 아이디어는 칸토로비치 쌍대를 근접 고정점 문제로 재구성하는 것이며, 이를 통해 적대적 훈련 대신 근접 최적성 조건을 사용하여 안정적인 단일 네트워크 프레임워크를 구축할 수 있습니다. 특히, 내부 고정점 계산 과정에서도 미분 없이 기울기(gradients)를 계산할 수 있는 장점을 제공합니다.

MASS-DPO: 다중 부정적 능동 샘플 선택을 통한 직접 정책 최적화

MASS-DPO는 Plackett--Luce (PL) 모델 하의 다중 부정적 선호도 최적화를 위한 새로운 방법론입니다. 이 방법은 대규모 부정 풀에서 중복적인 기울기 계산 문제를 해결하기 위해, PL 특이적 피셔 정보량 목적 함수를 사용하여 간결하고 정보가 풍부한 부정 부분 집합을 능동으로 선택합니다. 그 결과, 정책 업데이트에 상호 보완적인 정보를 제공하는 최적의 샘플들을 선별하여, 기존 방법들보다 효율적이면서도 강력한 모델 정렬(alignment) 성능을 달성합니다.

확산 모델 훈련에서의 표현 저하 문제 규명

확산 모델의 훈련 과정은 '표현 저하'라는 최적화 병목 현상으로 인해 비효율적이며, 노이즈 증가에 따라 구조 왜곡과 불안정성을 보입니다. 본 논문은 이러한 문제가 신경 접선 커널 스펙트럼 약화와 관련된 '불일치한 목표 복구 가능성' 때문임을 규명했습니다. 이를 해결하기 위해, 효과적인 복구 가능성에 맞춰 최적화 노력을 동적으로 재할당하는 플러그 앤 플레이 프레임워크인 '규명된 표현 확산(ERD)'을 제안합니다.

선형 연관 기억에서의 사실적 회상: 날카로운 점근적 분석 및 기계론적 통찰

본 논문은 대규모 언어 모델(LLM)이 사실적 회상에서 보이는 능력을 분석하며, 특히 최소한의 설정으로 입력-출력 연관성을 저장하는 선형 연관 기억(linear associative memory)에 초점을 맞춥니다. 연구진은 이 과정이 요구하는 엄격한 분리 조건과 그로 인해 발생하는 제약 조건을 수학적으로 분석합니다. 또한, 최적 해가 단순한 Hebbian 학습 규칙보다 우수하며, 이는 입력-출력 정렬을 높이기보다는 경쟁 출력에 의해 설정된 극값 임계치 근처에서 정확도를 끌어올리는 기계론적 원리를 제시합니다.

ConQuR: LLM을 위한 최적화된 회전을 이용한 코너 정렬 활성화 양자화

본 논문은 LLM의 높은 메모리 사용량과 추론 비용 문제를 해결하기 위해 최적화된 회전을 활용한 코너 정렬 활성화 양자화를 제안합니다. 기존 방법들이 요구하던 값비싼 종단 간 훈련이나 대규모 오프라인 데이터 저장 없이도, 경량의 사후 훈련(post-training) 회전 보정화 기법을 통해 Llama 모델군에서 경쟁적이거나 향상된 성능을 달성할 수 있음을 입증했습니다.

오류 경계 언어 생성(Mistake-Bounded Language Generation)

본 기사는 언어 생성 모델의 성능 평가 지표를 개선하기 위해 기존의 '마지막 오류 시점' 대신 '오류 경계 생성(mistake-bounded generation)'이라는 새로운 개념을 제안합니다. 이 접근 방식은 단순히 최종 결과의 일관성보다는, 생성 과정 전반에 걸쳐 발생하는 누적되는 유효하지 않은 요소(invalid elements)의 총 개수를 최소화하는 데 초점을 맞춥니다. 이를 통해 모델 학습 목표를 재정립하고, '정확한 시연으로부터 학습' 프레임워크와 연결하여 이론적인 기반을 마련합니다.

Transcoda: 데이터 중심 합성 학습을 통한 종단 간 제로샷 광음악 인식 (Optical Music Recognition)

본 기술 기사는 광음악 인식(OMR) 분야의 주요 난제들을 다루고 있습니다. 현재 OMR은 대규모 주석 데이터셋 부족과 비유일성 인코딩으로 인한 학습 및 디코딩 과정의 불확실성을 겪고 있습니다. 이를 해결하기 위해, 논문에서는 'Transcoda'라는 새로운 시스템을 제안하며, 이는 데이터 중심 합성 학습(data-centric synthetic learning) 접근 방식을 통해 OMR 성능 향상을 목표로 합니다.

이 피드 구독하기

RSSFeedly, Inoreader 등으로 구독

API/api/search?q=검색어

AIllms.txt로 AI 크롤링 가이드

본 페이지의 콘텐츠는 AI가 공개된 소스를 기반으로 자동 수집·요약·번역한 것입니다. 원 저작권은 각 원저작자에게 있으며, 각 게시물의 “원문 바로가기” 링크를 통해 원문을 확인할 수 있습니다. 저작권자의 삭제 요청이 있을 경우 신속히 조치합니다.