Insights
AI가 자동으로 큐레이션·번역·정리하는 기술 동향 피드입니다.
여성 성 노동자의 설명 가능한 정신 건강 위험 예측을 위한 앙상블 특징 선택 및 Harris Hawks Optimization
여성 성 노동자의 우울증 위험을 예측하기 위해 앙상블 특징 선택과 Harris Hawks Optimization을 결합한 하이브리드 모델을 제안합니다. XAI를 통해 트라우마 요인을 식별하며, 높은 정확도로 취약 계층을 위한 맞춤형 심리 사회적 케어 지원 가능성을 제시합니다.
오토인코더 (Autoencoder)를 이용한 신속한 FinFET 모델링
오토인코더(Autoencoder)를 활용하여 FinFET 소자의 I-V 특성을 효율적으로 모델링하는 머신러닝 프레임워크를 제안합니다. 저차원 잠재 공간을 통해 소자의 물리적 특성을 인코딩하며, 최소한의 데이터로도 높은 정확도의 소자 지표 추출이 가능합니다.
RAVEN: 금융 시계열 예측을 위한 체제 인식 가변 컨텍스트 전문가 네트워크
금융 시계열의 비정상성과 낮은 신호 대 잡음비를 해결하기 위해 가변 컨텍스트 전문가 네트워크인 RAVEN을 제안합니다. 데이터에 따라 최적의 룩백 기간을 결정하는 계층적 윈도우 구조와 전문가 혼합(MoE) 방식을 통해 SOTA 성능을 달성했습니다.
CAVEWOMAN: 언어적 입력 및 출력 압축 시 대규모 언어 모델(LLM)의 동작 방식
LLM의 입력 및 출력 압축이 추론 비용과 정확도에 미치는 영향을 분석한 연구입니다. 출력 압축은 비용을 절감하지만, 입력 압축은 정확도 저하와 응답 길이 증가로 인해 오히려 비용을 높이는 결과를 초래함을 밝혀냈습니다.
온폴리시 증류 (On-Policy Distillation)를 위한 블록 단위 정책 드리프트 게이팅 (Blockwise Policy-Drift
온폴리시 증류(OPD) 과정에서 긴 추론 작업의 성능을 높이기 위해 블록 단위 정책 드리프트 게이팅 기법을 제안합니다. 학생 모델의 로그 확률 변화량을 블록 단위로 집계하여 손실 가중치를 재조정함으로써 수학 추론 성능을 향상시킵니다.
NeuroSonic: EEG-to-Speech 재구성을 위한 조건부 흐름 매칭 (Conditional Flow Matching)
NeuroSonic은 EEG 신호를 기반으로 연속적인 음성을 재구성하는 조건부 흐름 매칭(Conditional Flow Matching) 프레임워크입니다. 결정론적 확률 흐름 속도장을 학습하여 기존 확산 모델의 불안정성을 극복하고 음성 재구성의 품질을 크게 향상시켰습니다.
PORTER: 휴대 가능한 구조화된 EHR 파운데이션 모델을 위한 언어 기반 이벤트 표현
PORTER은 고정된 어휘 집합 대신 언어 기반 설명을 사용하여 임상 이벤트를 표현하는 EHR 파운데이션 모델입니다. 수치 값 통합과 시계열 백본을 통해 새로운 개념에 대한 유연한 대응과 높은 전이 학습 성능을 보여줍니다.
다중 목적 강화학습 (Multi-Objective Reinforcement Learning)을 통한 LLM 사전 학습용 통합 데이터 스케줄러
LLM 사전 학습 시 데이터 혼합을 최적화하기 위한 새로운 프레임워크인 HDS를 제안합니다. 다중 목적 강화학습(SAC)을 활용하여 데이터 품질, 손실, 모델 가중치를 통합적으로 고려한 스케줄링을 수행합니다.
Top-1이 실패할 때: Masked Diffusion LM을 위한 LoRA 모니터 보정
이산 확산 언어 모델(DLM)의 LoRA 미세 조정 시 기존의 top-1 집중도 모니터링이 실제 모델 붕괴를 예측하지 못하는 문제를 분석합니다. 연구팀은 이를 해결하기 위해 max LoRA 그래디언트 노름을 활용한 새로운 보정 방법을 제안합니다.
FedUP: 중심점 유도형 플러그인 필터를 활용한 원샷 연합 언러닝 (One-Shot Federated Unlearning)
FedUP은 연합 언러닝(Federated Unlearning) 과정에서 발생하는 지식 손실과 지연 시간 문제를 해결하기 위한 새로운 프레임워크입니다. 플러그형 필터를 사용하여 모델 성능을 보존하면서도 단 몇 초 만에 대상 데이터를 제거할 수 있는 효율적인 방식을 제안합니다.
AsyncOPD: 온폴리시 증류(On-Policy Distillation)는 얼마나 오래된 데이터를 허용할 수 있는가?
비동기식 온폴리시 증류(OPD) 환경에서 발생하는 데이터 노후화(staleness) 문제를 체계적으로 분석한 연구입니다. KL 방향에 따른 강건성 차이를 규명하고, 학습 처리량을 최대 3.8배 향상시킨 비동기식 학습 파이프라인 AsyncOPD를 제안합니다.
이산 흐름 매칭 (Discrete Flow Matching)을 위한 시간 재매개변수화된 누적 강도 외삽 샘플러
이산 흐름 매칭(DFM)의 효율적인 샘플링을 위해 제안된 TR-CIE 샘플러에 관한 연구입니다. 시간 재매개변수화와 누적 강도 외삽 기술을 통해 추가적인 모델 평가 없이도 제한된 NFE 환경에서 샘플링 품질을 크게 향상시킵니다.
BehaviorBench: 행동 과학 태스크를 위한 파운데이션 모델(Foundation Models) 벤치마킹
행동 과학 태스크를 평가하기 위한 종합 벤치마크인 BehaviorBench와 미세 조정된 모델인 Be.FM-1.5를 소개합니다. 이 연구는 모델이 개인의 행동뿐만 아니라 인구 집단 수준의 분포를 얼마나 잘 정렬하는지 평가하는 데 중점을 둡니다.
온디바이스 결함 탐지를 위한 경량 Transformer 모델: 자원 제한적 배포에 관한 벤치마크 연구
자원 제한적인 온디바이스 환경에서 결함 탐지를 위한 경량 Transformer 모델과 전통적 ML 방법론의 성능을 비교 분석한 벤치마크 연구입니다. 모델 크기, 지연 시간, 정확도 간의 트레이드오프를 평가하며 양자화 및 적응형 추론 파이프라인의 효과를 검증합니다.
자기 진화형 월드 모델을 위한 반사실적 제어 가능성을 갖춘 자율 비디오 생성
비디오 생성 모델이 단순한 시각적 예측을 넘어, 반사실적 제어 가능성을 갖춘 자기 진화형 월드 모델로 나아가야 함을 제안합니다. 특정 행동에 따른 미래를 예측하고 신체화 제약을 검증하며, 이를 다시 생성 과정에 피드백하는 메커니즘을 강조합니다.
Project Ariadne: 합성 계획을 위한 프롬프트 조건부 경로 생성
Ariadne는 목표 분자와 제약 조건을 하나의 프롬프트로 처리하는 디코더 전용 역합성 경로 생성 모델입니다. 기존 방식과 달리 단일 모델로 다양한 계획 사양을 지원하며, 벤치마크 결과 기존 플래너 대비 높은 효율성과 성능을 입증했습니다.
고차원 스펙트럼 노름 볼(Spectral Norm Balls)에서의 균등 샘플링
단위 스펙트럼 노름 볼에서 행렬을 균등하게 샘플링할 때 발생하는 특이값의 수렴 현상을 다룹니다. 행렬 차원이 커질수록 모든 특이값이 1로 수렴함을 증명하여 대규모 언어 모델의 행렬 특성을 이론적으로 뒷받침합니다.
인도 언어 처리를 위한 파니니(Pāninian) 기반 체계
인도 언어들의 공통된 형태통사적 구조인 파니니(Pāninian) 프레임워크를 활용하여 파편화된 NLP 인프라를 통합하는 연구를 제안합니다. 이를 통해 데이터 효율성을 높이고, 통합된 계산 아키텍처와 벤치마크를 통해 언어 간 전이 학습을 강화하고자 합니다.
3D 인지 기하학적 제약 조건을 활용한 오픈 보카블러리 (Open-Vocabulary) BEV 세그멘테이션
자율 주행을 위한 오픈 보카블러리 BEV 세그멘테이션 프레임워크인 OVBEVSeg를 제안합니다. 3D 기하학적 제약 조건과 가우시안 스플래팅을 활용하여 2D VLM의 시맨틱스를 BEV로 정밀하게 투영하며, 기존 폐쇄 집합 방식보다 높은 성능과 효율성을 입증했습니다.
배터리 없는 IoT의 미지의 워크로드를 위한 작업 실행 관리: 하드웨어 불가지론적 평가
배터리 없는 에너지 수확 IoT 시스템을 위한 하드웨어 불가지론적 동적 스케줄링 전략을 제안합니다. RL 에이전트와 즉석 근사 예측(AP) 방식을 통해 예측 불가능한 워크로드와 변동성 큰 에너지 환경에서 효율적인 작업 실행 관리를 연구했습니다.
이 피드 구독하기
본 페이지의 콘텐츠는 AI가 공개된 소스를 기반으로 자동 수집·요약·번역한 것입니다. 원 저작권은 각 원저작자에게 있으며, 각 게시물의 “원문 바로가기” 링크를 통해 원문을 확인할 수 있습니다. 저작권자의 삭제 요청이 있을 경우 신속히 조치합니다.