Insights
AI가 자동으로 큐레이션·번역·정리하는 기술 동향 피드입니다.
arXiv cs.LG 272건필터 해제
수중 자율 탐색을 위한 태스크별 서브네트워크 발견 (RL)
자율 수중 차량(AUV)의 다중 작업 수행은 복잡하고 불확실한 환경에서 높은 신뢰성이 요구됩니다. 기존 제어기는 한계가 있으며, 강화학습 (RL) 기반 정책이 이를 해결할 대안으로 떠오르고 있습니다. 하지만 RL 모델은 여전히 '블랙박스' 문제로 인해 실제 적용에 어려움이 있습니다. 본 연구는 HoloOcean 시뮬레이터를 활용하여 다중 작업 RL 네트워크의 내부 구조를 분석하고, 특정 태스크(종류 탐색)별로 사용되는 서브네트워크를 식별했습니다. 그 결과, 관련 태스크 간 차이를 만드는 데 전체 가중치의 약 1.5%만 사용되며, 이
Dask 기반 대규모 데이터 병렬 처리를 통한 제품 양자화 및 역 인덱싱 최적화
본 논문은 대규모 근접 이웃 검색(Nearest Neighbor, NN)의 계산 복잡성 문제를 해결하기 위해 제품 양자화(Product Quantization, PQ)와 역 인덱싱(Inverted Indexing)을 결합하는 방법을 제시합니다. 특히 Python 환경에서 Dask 라이브러리를 활용하여 데이터 분할 및 병렬 처리를 수행함으로써, 대규모 고차원 데이터 클러스터링의 메모리 비용과 실행 시간을 획기적으로 줄였습니다. 이 접근 방식은 정확도를 유지하면서도 중규모 데이터 처리 수준으로 계산 요구 사항을 낮춰, 실제 산업 환경에
주기 신호 처리를 위한 저복잡도 R-DCNN 제안
본 논문은 음성, 음악, 의료 진단 등 다양한 분야에서 핵심 과제인 주기 신호의 노이즈 제거 및 파형 추정 문제를 다룹니다. 기존 딥러닝 방식들이 높은 계산 자원을 요구하고 개별 학습에 의존하는 한계를 극복하기 위해, 저전력 환경에 최적화된 R-DCNN (Dilated CNN + Re-sampling)을 제안합니다. 이 방법은 단일 관측만으로 다양한 기본 주파수를 가진 신호에 대해 훈련 가능하며, 가벼운 재샘플링(Resampling) 과정을 통해 네트워크 가중치를 공유하여 효율성을 극대화했습니다. 그 결과, 기존의 최신 AR 기반/
SCF 가속을 위한 솔버 정렬 초기화 학습 (SAIL) 기법 제안
본 논문은 분자 구조 기반의 초기 추측값 예측 모델이 큰 분자로 외삽(extrapolating)할 때 수렴 속도가 저하되는 문제를 해결하는 '솔버 정렬 초기화 학습 (SAIL)' 기법을 제안합니다. SAIL은 SCF 솔버를 통해 엔드투엔드로 미분함으로써, 단순히 목표 값에 맞는 모델이 아닌 실제 계산 과정에 최적화된 초기 추측값을 생성합니다. QM40과 같은 대형 분자 데이터셋에서 PBE, SCAN, B3LYP 등 다양한 이론 수준(level of theory)에서 기존 최고 성능 대비 27~37%의 에너지 반복 횟수 (ERIC)를
GEM: ReLU의 단점을 보완한 초매끄러운 활성화 함수 계열
본 논문은 기존 활성화 함수(예: ReLU)가 가지는 불연속성 문제를 해결하기 위해 $C^{2N}$-매끄러운 특성을 가진 새로운 계열의 활성화 함수, GEM(Geometric Monomial)을 제안합니다. GEM은 유리수 산술만을 사용하면서도 ReLU와 유사한 성능을 달성하며, 세 가지 변형체(GEM, E-GEM, SE-GEM)를 제시합니다. 특히 $N=1$ 설정이 표준 깊이 네트워크에서 최적의 성능을 보이며, CIFAR-100 + ResNet-56에서 GELU 대비 큰 폭으로 성능 향상을 입증했습니다. 이 연구는 CNN과 트랜스
A-IC3: 하드웨어 모델 검증을 위한 적응형 귀납적 일반화 학습
본 논문은 최신 하드웨어 모델 검증 기법인 IC3의 성능 향상을 목표로 합니다. 특히, 카운터예제(counterexample)를 더 넓은 상태 집합으로 일반화하는 '귀납적 일반화 (inductive generalization)' 과정에 초점을 맞춥니다. 기존 방식들이 고정된 전략을 사용해 검증 환경 변화에 취약했던 문제를 해결하기 위해, 본 연구는 다중 팔 밴딧 (Multi-Armed Bandit, MAB) 알고리즘 기반의 경량 머신러닝 프레임워크를 제안합니다. 이 프레임워크는 실시간 피드백을 바탕으로 최적의 일반화 전략을 동적으로
DNABERT-2 기반 유전체 언어 모델의 사후 설명 가능성 평가
본 연구는 트랜스포머 기반 유전체 언어 모델(gLM)의 예측 결과에 대한 '사후 설명(Post-hoc Explanation)' 가능성을 평가합니다. 특히, 기존 CNN에서 성공적이었던 패턴 추출 기법이 gLM에도 적용 가능한지 검증하는 것이 목표입니다. 연구진은 Attention 메커니즘에 적응시킨 Layer-wise Relevance Propagation (LRP) 기반 방법인 AttnLRP를 DNABERT-2에 적용하고, 토큰 및 뉴클레오타이드 수준에서 설명 전략을 제안했습니다. 그 결과, AttnLRP가 알려진 생물학적 패턴과
딥러닝 이론의 출현: '학습 역학(Learning Mechanics)' 제안
본 논문은 딥러닝에 대한 과학적 이론이 점차 형성되고 있음을 주장하며, 이를 '학습 역학(learning mechanics)'이라는 관점으로 정의합니다. 이 이론은 신경망의 학습 과정 동역학, 은닉 표현(hidden representations), 최종 가중치 및 성능 등의 중요한 통계적 속성을 특징화하는 것을 목표로 합니다. 저자들은 현재 진행 중인 연구들을 종합하여 5가지 주요 연구 분야를 제시하며, 이러한 접근법들이 '학습 프로세스의 역학'에 초점을 맞추고 정량적으로 검증 가능한 예측을 제공한다고 강조합니다.
범용 테이블 임베딩 평가 벤치마크: TEmBed 소개
테이블 데이터 기반 모델(Foundation Models)이 다양한 작업과 도메인에서 전이 가능한 범용 표현을 학습하는 것이 중요해지고 있습니다. 하지만 기존 연구들은 작업별로 평가되어 직접적인 비교가 어렵습니다. 본 논문은 이러한 문제를 해결하기 위해 'TEmBed (Tabular Embedding Test Bed)'라는 포괄적인 벤치마크를 제안합니다. TEmBed는 셀(cell), 행(row), 열(column), 테이블(table)의 네 가지 표현 수준에 걸쳐 다양한 임베딩 모델을 체계적으로 평가하며, 실제 응용 분야에서 어떤
불확실성 하 순차적 의사결정의 공정성 확보 방안
본 논문은 기존의 지도 학습(Supervised Learning) 기반 공정성 연구가 다루지 못했던, 온라인 및 순차적인 의사결정 과정에서의 공정성 문제를 다룹니다. 특히, 관측되지 않은 반사실적 상황(counterfactuals)과 제한된 샘플로 인해 발생하는 '불확실성'이 어떻게 특정 취약 계층에게 불공정한 결과를 초래하는지 분석합니다. 모델 및 피드백 불확실성을 카운터팩추얼 논리(Counterfactual Logic)와 강화학습 (RL)을 통해 정식화하고, 이 불확실성을 고려하여도 제도적 목표(예: 기대 효용, expected
Ramen: 혼합 도메인 환경을 위한 강력한 테스트 시간 적응 프레임워크
CLIP과 같은 사전 학습된 비전-언어 모델(VLM)은 제로샷 일반화 능력이 뛰어나지만, 실제 환경의 분포 변화에 취약합니다. 기존 테스트 시간 적응(Test-Time Adaptation, TTA) 방법들은 단일 도메인 가정 하에 설계되어 혼합 도메인 데이터셋에서 성능 저하를 겪습니다. 본 논문은 'Ramen'이라는 프레임워크를 제안하며, 능동 샘플 선택(Active Sample Selection)을 통해 이러한 문제를 해결합니다. Ramen은 들어오는 테스트 샘플마다 두 가지 기준(도메인 일관성 및 예측 균형)에 따라 과거 데이터
변수 과포화도 고려한 결정 성장 동역학의 신경 대체 모델 연구
본 논문은 Allen-Cahn 역학을 기반으로 계산된 결정 성장 시뮬레이션 데이터를 활용하여, 변하는 과포화도(supersaturation)의 영향을 고려한 신경 대체 모델(Neural Surrogate Models) 두 가지를 제안합니다. 이 모델들은 각각 과포화도를 암묵적(implicit) 또는 명시적(explicit) 방식으로 조건화합니다. 실험 결과, 과포화도를 초기 입력과 함께 명시적으로 제공하는 방식이 가장 높은 정확도로 실제 결과를 재현하며, 데이터셋 크기나 입력 시퀀스 길이와 관계없이 우수한 성능을 보였습니다. 또한,
딥페이크 탐지: 얼굴 역학 기반의 해석 가능한 접근법 제시
본 연구는 기존 딥러닝 기반의 딥페이크 탐지 방식이 '무엇이 진짜와 가짜를 구별하는가'에 대한 해석 가능성(interpretability)이 부족하다는 문제점을 지적합니다. 대신, 얼굴 움직임의 생체 행동학적 특징을 활용하여 저차원 패턴을 추출하고 이를 기반으로 딥페이크 탐지 모델을 구축했습니다. 실험 결과, 특히 감정 표현(emotive expressions)이 포함된 영상에서 높은 정확도를 보였으며, 이는 딥페이크가 감정 신호를 체계적으로 왜곡한다는 것을 의미합니다. 나아가 모델의 예측과 인간의 지각적 판단 간의 관계를 분석하여
물리 기반 표현 학습을 통한 범용 PINN 모델 개발
본 논문은 기존 물리정보 신경망(PINNs)의 일반화 문제를 해결하기 위해 'Pi-PINN'이라는 전이 학습 접근 방식을 제안합니다. Pi-PINN은 공유 임베딩 공간에서 전이 가능한 물리 기반 표현을 학습하며, 폐쇄형 근사역행렬(closed-form head adaptation) 기법을 사용하여 알려지지 않은 PDE 인스턴스에서도 빠르고 정확하게 해를 예측할 수 있습니다. 이 방법은 기존 PINN 대비 100~1000배 빠른 추론 속도를 제공하며, 단 두 개의 학습 샘플만으로도 데이터 기반 모델보다 10~100배 낮은 상대 오차율
PrismaDV: 태스크 의존적 데이터 유닛 테스트 자동 생성 시스템
기존의 데이터 단위 테스트 프레임워크는 데이터를 소비하는 코드의 의미론적 요구사항(semantics)을 고려하지 못하는 '태스크 비의존적(task-agnostic)' 방식이었습니다. 본 논문은 이를 개선한 AI 시스템인 PrismaDV를 제안합니다. PrismaDV는 다운스트림 태스크 코드를 분석하여 데이터 접근 패턴과 암묵적인 데이터 가정을 파악하고, 이에 기반한 실행 가능한 '태스크 의식적(task-aware)' 데이터 단위 테스트를 자동으로 생성합니다. 또한, SIFTA라는 프롬프트 최적화 프레임워크를 통해 테스트 결과를 지속
금융 네트워크의 리스크 관리: 규제 준수와 정보 공유 메커니즘 설계
본 논문은 공동 고객을 보유한 경쟁 금융사들이 직면하는 '정보 집계 문제'를 다룹니다. 개별 기업의 인센티브 구조 때문에 위험 고객(risky customers)에 대한 효율적인 정보 공유가 어렵다는 점에 착안하여, 탈세자금 방지(AML) 분야의 메커니즘 설계 프레임워크를 제시합니다. 핵심은 '시간적 가치 할당 (Temporal Value Assignment, TVA)'이라는 새로운 기법입니다. TVA는 할인된 검증 결과에 대해 엄격한 적합 점수 규칙(strictly proper scoring rule)을 사용하여 기관에 크레딧을
Hartigan k-means 알고리즘의 효과적인 변형 연구
본 논문은 고전적인 클러스터링 문제인 $k$-means를 다루며, 기존의 Lloyd's algorithm이나 Hartigan의 방법론보다 더 나은 성능을 보이는 미세한 변형 알고리즘을 제안합니다. 이 새로운 접근 방식은 일반적인 경우에 2%~5%의 추가적인 개선 효과를 가져오며, 특히 데이터 차원(dimension)이나 클러스터 개수($k$)가 증가할 때 그 개선 폭이 커지는 경향을 보입니다. 개발자 관점에서 이는 기존 $k$-means 구현의 성능 최적화 기회를 제공합니다.
군(Group) 대칭성을 고려한 분수 공간 확산 모델 (Quotient-Space Diffusion Models)
본 논문은 특정 시스템에 내재된 군(group) 대칭성(symmetry)을 활용하여 생성 모델의 효율성과 정확도를 높인 '분수 공간 확산 모델' 프레임워크를 제안합니다. 특히, 분자 구조 생성과 같이 $ ext{SE}(3)$와 같은 특수 유클리드 그룹(Special Euclidean Group)에 의해 대칭성을 갖는 분야에 적용 가능합니다. 이 방법은 기존의 군 등변(group-equivariant) 확산 모델들이 복잡하게 학습해야 했던 그룹 작용 관련 요소를 제거하여 학습 난이도를 낮추고, 샘플러가 목표 분포를 정확히 재현함을 보
합의 도출 이론: 의견 공간에서 공통 접점을 학습하는 방법
본 논문은 온라인 토론 플랫폼에서 사용자의 선호도만으로는 부족한, 광범위하게 합의 가능한 핵심 주제(Common Ground)를 찾는 이론적 프레임워크를 제시합니다. 이를 위해 고차원 데이터로부터 임베딩 및 차원 축소를 통해 1차원 의견 공간을 구축하고, 이 공간 내에서 '가설 구간(hypothesis interval)'에 대한 기대 합의도를 최대화하는 목표 함수를 정의했습니다. 제안된 효율적인 Empirical Risk Minimization (ERM) 알고리즘은 PAC-learning 보장을 제공하며, 실제 실험에서는 적은 수의
쿠프만 고유함수 대수학을 이용한 동역학 시스템 해석 기법
본 논문은 가역 궤적(reversible trajectories)을 가진 연속 시간 역학계의 쿠프만 연산자(Koopman operator) 고유함수들이 곱셈군(multiplicative group)을 형성한다는 수학적 특성을 활용합니다. 이 성질을 이용해 적은 수의 '주요' 고유함수 근사치로부터 다항식 구성만으로 훨씬 더 많은 고유함수를 체계적으로 계산할 수 있습니다. 또한, 국소적인 데이터 샘플링에서 전역적이고 일관된 표현(global representations)을 학습하는 것을 목표로 하며, 특히 특이점(singularites
이 피드 구독하기
본 페이지의 콘텐츠는 AI가 공개된 소스를 기반으로 자동 수집·요약·번역한 것입니다. 원 저작권은 각 원저작자에게 있으며, 각 게시물의 “원문 바로가기” 링크를 통해 원문을 확인할 수 있습니다. 저작권자의 삭제 요청이 있을 경우 신속히 조치합니다.