Insights
AI가 자동으로 큐레이션·번역·정리하는 기술 동향 피드입니다.
arXiv cs.LG 2125건필터 해제
소프트 하모닉 함수 기반 조건부 이상 탐지 방법론 제안
본 논문은 데이터 인스턴스가 비정상적인 응답이나 클래스 레이블을 가질 때 이를 식별하는 '조건부 이상 탐지(conditional anomaly detection)' 문제를 다룹니다. 저자들은 소프트 하모닉 솔루션에 기반한 새로운 비모수적 접근 방식을 개발하여, 레이블의 신뢰도를 추정함으로써 이상하게 잘못 지정된 레이블(anomalous mislabeling)을 탐지하는 방법을 제시합니다. 또한, 고립된 예제나 분포 지지 경계상의 예제를 탐지하지 않도록 솔루션을 정규화했습니다. 이 방법론은 합성 데이터셋 및 UCI ML 데이터셋뿐만류
시간적 일관성을 강화하는 동역학 사전(Dynamical Prior) 기반 강화학습
기존 강화학습 (RL)은 보상 최대화에 초점을 맞춰 시간적으로 비일관적인 행동(예: 갑작스러운 신뢰도 변화, 진동 등)을 보이는 정책을 학습시킬 수 있습니다. 본 논문에서는 동역학 사전 (Dynamical Prior Reinforcement Learning, DP-RL)이라는 새로운 훈련 프레임워크를 제안합니다. 이는 보상 함수나 환경 구조를 변경하지 않으면서 외부 상태 역학에서 파생된 추가 손실(auxiliary loss)을 정책 경사 학습에 통합하여 행동 확률의 시간적 진화를 제어합니다. 실험 결과, DP-RL은 에이전트가 과제
잔여 그래프 동형성 네트워크 기반 약물 시너지 예측 모델 (ResGIN-Att)
단일 약물 치료의 한계를 극복하기 위해 복합 약물 요법(combination drug therapies)이 주목받고 있지만, 모든 조합을 실험적으로 검증하는 것은 비용적 부담이 큽니다. 본 논문은 이러한 문제를 해결하고자 분자 구조 특징과 세포주 유전체 프로파일을 통합한 협업 예측 그래프 신경망 (collaborative prediction graph neural network)을 제안합니다. 핵심 모델인 잔여 그래프 동형성 네트워크와 어텐션 메커니즘(ResGIN-Att)은 약물 분자의 다중 스케일 위상적 특징을 추출하고, 이를 약
저가 공기질 센서 보정(Calibration)을 위한 시계열 딥러닝 프레임워크
본 논문은 저비용 공기질 센서(LCS)의 측정값(PM$_{2.5}$, PM$_{10}$, NO$_2$)을 보정하기 위한 시계열 딥러닝 프레임워크를 제안합니다. LCS는 고가 규제 등급 장비를 대체할 수 있지만, 센서 드리프트나 환경 간섭 같은 보정 문제로 인해 활용에 한계가 있습니다. 본 연구는 영국 Oxford의 OxAria 네트워크에서 얻은 공동 배치(co-located) 기준 데이터를 사용하여 LSTM (Long Short-Term Memory) 네트워크를 훈련시킵니다. 기존 방식이 개별 관측치를 독립적으로 처리하는 것과 달리
수요 예측과 공급망 최적화를 결합한 하이브리드 AI 프레임워크
본 논문은 변동성이 큰 수요와 불확실한 공급 환경(예: 섬유, PPE)에서 발생하는 문제를 해결하기 위해 '수요-공급 예측 및 최적화 하이브리드 AI 프레임워크 (HAF-DS)'를 제안합니다. 이 프레임워크는 시계열 패턴을 포착하는 LSTM 기반의 수요 예측 모듈과 비용 효율적인 재고/배분 결정을 내리는 혼합 정수 선형 프로그래밍(MILP) 최적화 계층을 통합했습니다. 실험 결과, 기존 방식 대비 MAE를 15.04에서 12.83으로 (14.7%), 서비스 수준을 95.5%에서 97.8%로 끌어올리며 예측 정확도와 운영 효율성을 극
개인정보 보호 LLM 개인화: 분리 가능한 전문가 아키텍처 제안
본 논문은 사용자 데이터를 공유 가중치에 직접 통합하는 기존의 LLM 개인화 방식이 가진 데이터 삭제 및 프라이버시 문제를 해결하기 위해 '분리 가능한 전문가 아키텍처(Separable Expert Architecture)'를 제안합니다. 이 아키텍처는 정적 기반 모델, 사용자의 행동을 형성하는 컴포저블 도메인-전문가 LoRA 어댑터, 그리고 사용자별 삭제 가능 프록시(Deletable User Proxies)의 3계층 구조로 구성됩니다. 핵심은 개인 데이터가 공유 가중치에 절대 영향을 주지 않도록 분리함으로써, 모델 역전(Innv
CoFEE: LLM 기반 특징 발견을 위한 추론 제어 프레임워크
본 논문은 복잡한 비정형 데이터에서 예측력이 높은 특징(feature)을 추출하는 과정이 본질적으로 '추론 문제'임을 지적하며, 이를 해결하기 위한 프레임워크 CoFEE를 제안합니다. CoFEE는 LLM의 추론 과정을 구조화하고 인지적 행동(cognitive behaviors)을 강제하여, 단순한 무제한 생성 방식보다 훨씬 높은 품질과 효율성을 보여줍니다. 구체적으로, CoFEE는 평균 성공률 점수(Success Rate Score)를 기존 방식 대비 15.2% 향상시키면서도 특징 개수는 29% 줄이고 비용은 53.3% 절감하는 성
다변량 컨포멀 예측을 위한 커널 비적합도 점수 (MKS)
본 논문은 다변량 데이터의 불확실성을 모델링하는 데 필요한 새로운 '다변량 커널 점수(Multivariate Kernel Score, MKS)'를 제안합니다. MKS는 잔차 벡터를 스칼라로 압축하면서도 원래 분포가 가진 기하학적 구조를 보존하도록 설계되었습니다. 이 점수는 가우시안 프로세스 (Gaussian Process)의 사후 분산과 유사하여 베이즈 불확실성 정량화와 빈도주의적(frequentist-type) 커버리지 보장이라는 두 가지 장점을 통합합니다. 특히, MKS는 비등방성 최대 평균 불일치(anisotropic MMD)
ML 해석 가능성 검증을 위한 출처(Provenance) 활용 방안
기계 학습 (ML) 시스템의 신뢰성과 엄격한 개발이 중요해지면서, 모델의 '해석 가능성(Interpretability)'과 같은 비기능적 요구사항(NFRs) 검증이 핵심 과제로 떠올랐습니다. 본 논문은 ML 출처 정보(Provenance)를 활용하여 이 해석 가능성 NFR을 정량적으로 검증할 수 있는 새로운 접근 방식을 제시합니다. 모델 및 데이터의 다양한 출처 정보를 기록하고 저장함으로써, 모델의 동작을 투명하게 만들고 이를 기반으로 측정 가능한 기능적 요구사항(FRs)을 도출해 해석 가능성을 최종적으로 검증하는 방법을 제안합니다
메멤리스터 기반 리저버 컴퓨팅: 이미지 분류 성능 및 안정성 분석
본 논문은 휘발성 메멤리스터(volatile memristors)를 활용한 병렬 지연 피드백 네트워크(PDFN) 기반 리저버 컴퓨팅(RC) 아키텍처의 성능을 분석합니다. 특히, 장치 특성(감쇠율, 양자화, 가변성 등)이 리저버 성능에 미치는 영향을 심층적으로 다루고, 데이터 전처리 기법을 적용하여 이를 개선하는 방안을 제시합니다. 제안된 방법은 MNIST 분류에서 95.89%의 높은 정확도를 달성했으며, 장치 변동성이 20%까지 높아져도 94.2%의 안정적인 성능을 유지함을 입증했습니다. 이는 휘발성 메멤리스터가 고속, 저전력 뉴로
IoT 침입 탐지를 위한 시간 인식 하이브리드 인코딩 기반 시스템 A-THENA
본 논문은 급증하는 사물인터넷(IoT) 기기로 인해 커진 공격 표면을 방어하기 위해, 경량화된 조기 침입 탐지 시스템(EIDS) A-THENA를 제안합니다. A-THENA는 패킷의 시간 정보를 활용하는 일반화된 시간 인식 하이브리드 인코딩 (THE)과 네트워크 특화 증강(NA) 파이프라인을 결합한 트랜스포머 기반 아키텍처입니다. CICIoT23-WEB, MQTT-IoT-IDS2020, IoTID20 등 세 가지 벤치마크 데이터셋에서 테스트 결과, 기존 최고 성능의 위치 인코딩 대비 평균 정확도를 6.88%p 향상시켰으며, 실제 라즈
이벤트 로그 예측: 단순 에이전트 앙상블로 성능과 효율 모두 잡기
본 논문은 스트리밍 이벤트 로그에서 다음 활동(next-activity)을 예측하는 모델의 효율성과 정확도를 비교합니다. 기존 연구들이 복잡한 신경망(LSTM, Transformer)에 의존했던 것과 달리, 저가형 오토마타 기반 n-gram 모델이 적절한 컨텍스트 창을 사용할 경우 유사한 수준의 정확도를 달성하면서도 훨씬 낮은 자원을 요구함을 입증했습니다. 특히, 기존 앙상블 기법(예: 투표 방식)은 추론 시 다수의 에이전트를 병렬로 실행해야 하므로 메모리 사용량과 지연 시간(latency) 증가라는 단점이 있습니다. 이에 저자들은
임상 데이터셋 압축을 위한 기하학적 궤적 근사치(Surrogates) 연구
본 논문은 대규모 실제 데이터를 효율적으로 학습에 활용할 수 있도록 축소된 합성 데이터셋을 만드는 '데이터셋 응축(Dataset Condensation)' 기법을 다룹니다. 특히 널리 사용되는 '궤적 매칭(Trajectory Matching, TM)' 방식의 구조적 한계를 분석하고, 이를 개선하기 위해 **베지어 궤적 매칭(Bezier Trajectory Matching, BTM)**을 제안합니다. BTM은 무작위 경사 하강법(SGD)으로 얻는 복잡한 훈련 궤적 대신, 초기 및 최종 모델 상태 사이를 연결하는 이차 베지어 곡선 근사
수중 자율 탐색을 위한 태스크별 서브네트워크 발견 (RL)
자율 수중 차량(AUV)의 다중 작업 수행은 복잡하고 불확실한 환경에서 높은 신뢰성이 요구됩니다. 기존 제어기는 한계가 있으며, 강화학습 (RL) 기반 정책이 이를 해결할 대안으로 떠오르고 있습니다. 하지만 RL 모델은 여전히 '블랙박스' 문제로 인해 실제 적용에 어려움이 있습니다. 본 연구는 HoloOcean 시뮬레이터를 활용하여 다중 작업 RL 네트워크의 내부 구조를 분석하고, 특정 태스크(종류 탐색)별로 사용되는 서브네트워크를 식별했습니다. 그 결과, 관련 태스크 간 차이를 만드는 데 전체 가중치의 약 1.5%만 사용되며, 이
Dask 기반 대규모 데이터 병렬 처리를 통한 제품 양자화 및 역 인덱싱 최적화
본 논문은 대규모 근접 이웃 검색(Nearest Neighbor, NN)의 계산 복잡성 문제를 해결하기 위해 제품 양자화(Product Quantization, PQ)와 역 인덱싱(Inverted Indexing)을 결합하는 방법을 제시합니다. 특히 Python 환경에서 Dask 라이브러리를 활용하여 데이터 분할 및 병렬 처리를 수행함으로써, 대규모 고차원 데이터 클러스터링의 메모리 비용과 실행 시간을 획기적으로 줄였습니다. 이 접근 방식은 정확도를 유지하면서도 중규모 데이터 처리 수준으로 계산 요구 사항을 낮춰, 실제 산업 환경에
주기 신호 처리를 위한 저복잡도 R-DCNN 제안
본 논문은 음성, 음악, 의료 진단 등 다양한 분야에서 핵심 과제인 주기 신호의 노이즈 제거 및 파형 추정 문제를 다룹니다. 기존 딥러닝 방식들이 높은 계산 자원을 요구하고 개별 학습에 의존하는 한계를 극복하기 위해, 저전력 환경에 최적화된 R-DCNN (Dilated CNN + Re-sampling)을 제안합니다. 이 방법은 단일 관측만으로 다양한 기본 주파수를 가진 신호에 대해 훈련 가능하며, 가벼운 재샘플링(Resampling) 과정을 통해 네트워크 가중치를 공유하여 효율성을 극대화했습니다. 그 결과, 기존의 최신 AR 기반/
SCF 가속을 위한 솔버 정렬 초기화 학습 (SAIL) 기법 제안
본 논문은 분자 구조 기반의 초기 추측값 예측 모델이 큰 분자로 외삽(extrapolating)할 때 수렴 속도가 저하되는 문제를 해결하는 '솔버 정렬 초기화 학습 (SAIL)' 기법을 제안합니다. SAIL은 SCF 솔버를 통해 엔드투엔드로 미분함으로써, 단순히 목표 값에 맞는 모델이 아닌 실제 계산 과정에 최적화된 초기 추측값을 생성합니다. QM40과 같은 대형 분자 데이터셋에서 PBE, SCAN, B3LYP 등 다양한 이론 수준(level of theory)에서 기존 최고 성능 대비 27~37%의 에너지 반복 횟수 (ERIC)를
GEM: ReLU의 단점을 보완한 초매끄러운 활성화 함수 계열
본 논문은 기존 활성화 함수(예: ReLU)가 가지는 불연속성 문제를 해결하기 위해 $C^{2N}$-매끄러운 특성을 가진 새로운 계열의 활성화 함수, GEM(Geometric Monomial)을 제안합니다. GEM은 유리수 산술만을 사용하면서도 ReLU와 유사한 성능을 달성하며, 세 가지 변형체(GEM, E-GEM, SE-GEM)를 제시합니다. 특히 $N=1$ 설정이 표준 깊이 네트워크에서 최적의 성능을 보이며, CIFAR-100 + ResNet-56에서 GELU 대비 큰 폭으로 성능 향상을 입증했습니다. 이 연구는 CNN과 트랜스
A-IC3: 하드웨어 모델 검증을 위한 적응형 귀납적 일반화 학습
본 논문은 최신 하드웨어 모델 검증 기법인 IC3의 성능 향상을 목표로 합니다. 특히, 카운터예제(counterexample)를 더 넓은 상태 집합으로 일반화하는 '귀납적 일반화 (inductive generalization)' 과정에 초점을 맞춥니다. 기존 방식들이 고정된 전략을 사용해 검증 환경 변화에 취약했던 문제를 해결하기 위해, 본 연구는 다중 팔 밴딧 (Multi-Armed Bandit, MAB) 알고리즘 기반의 경량 머신러닝 프레임워크를 제안합니다. 이 프레임워크는 실시간 피드백을 바탕으로 최적의 일반화 전략을 동적으로
DNABERT-2 기반 유전체 언어 모델의 사후 설명 가능성 평가
본 연구는 트랜스포머 기반 유전체 언어 모델(gLM)의 예측 결과에 대한 '사후 설명(Post-hoc Explanation)' 가능성을 평가합니다. 특히, 기존 CNN에서 성공적이었던 패턴 추출 기법이 gLM에도 적용 가능한지 검증하는 것이 목표입니다. 연구진은 Attention 메커니즘에 적응시킨 Layer-wise Relevance Propagation (LRP) 기반 방법인 AttnLRP를 DNABERT-2에 적용하고, 토큰 및 뉴클레오타이드 수준에서 설명 전략을 제안했습니다. 그 결과, AttnLRP가 알려진 생물학적 패턴과
이 피드 구독하기
본 페이지의 콘텐츠는 AI가 공개된 소스를 기반으로 자동 수집·요약·번역한 것입니다. 원 저작권은 각 원저작자에게 있으며, 각 게시물의 “원문 바로가기” 링크를 통해 원문을 확인할 수 있습니다. 저작권자의 삭제 요청이 있을 경우 신속히 조치합니다.