© 2026 Molayo

Insights

AI가 자동으로 큐레이션·번역·정리하는 기술 동향 피드입니다.

효율적인 어노테이션을 위한 작업 분해 (Task Decomposition)

대규모 코퍼스에서 고품질 구조화 데이터를 수집할 때 발생하는 높은 비용과 추론 부하 문제를 해결하기 위한 연구입니다. 어노테이션 작업을 하위 작업으로 분해하여 전체적인 추론 부하를 줄이고 효율성을 높이는 방법론을 제안합니다.

U-Net을 넘어: Flow-Matching 음성 향상을 위한 잠재 표현 정렬 기반의 Skip-Free 백본

Flow-Matching 기술을 활용하여 음성 향상(Speech Enhancement)의 효율성을 높이는 새로운 Skip-free 백본 구조를 제안합니다. U-Net의 스킵 연결 대신 잠재 표현 정렬(LRA)을 사용하여 적은 추론 단계만으로도 고품질의 음성 복원이 가능함을 입증했습니다.

적응형 스케줄 최적화를 통한 정보 이론적 Classifier-Free Guidance

확산 모델의 Classifier-Free Guidance(CFG) 과정에서 발생하는 일관성과 다양성 간의 트레이드오프 문제를 해결하기 위한 정보 이론적 프레임워크를 제안합니다. 적응형 스케줄 최적화를 통해 노이즈 레벨에 따라 가이던스를 선택적으로 할당하여 생성 품질을 개선합니다.

확장성(Scale)이 거대 언어 모델(LLM)의 가소성 상실(Plasticity Loss)을 해결할 수 있을까?

LLM의 지속적 학습 과정에서 발생하는 가소성 상실(Plasticity Loss) 현상을 연구했습니다. 모델 크기가 커질수록 가소성 상실의 발생이 지연되지만, 파라미터 확장만으로는 이를 완전히 해결할 수 없음을 확인했습니다.

태스크 특화 LLM 증류(Distillation)를 위한 스케일링 법칙 (Scaling Laws)

도메인 특화 LLM 압축을 위한 경험적 스케일링 법칙을 제안하는 연구입니다. 데이터셋 크기, 압축률, 지도 형식 등이 도메인 지식 및 일반 지식 성능에 미치는 영향을 정량화했습니다.

UniDrive: 자율 주행의 해석 가능한 위험 이해를 위한 통합 시각-언어 및 그라운딩 (Grounding) 프레임워크

UniDrive는 자율 주행의 위험 이해를 위해 시간적 추론과 고해상도 인지를 결합한 통합 시각-언어 및 그라운딩 프레임워크입니다. 다중 프레임 입력과 게이트형 교차 주의 집중 모듈을 통해 정밀한 공간적 증거와 동적 컨텍스트를 정렬하여 위험을 설명합니다.

DeepBD: 유전적 선천성 결함의 변이 우선순위 지정 및 진단을 위한 근거 기반 에이전트 워크플로

DeepBD는 유전적 선천성 결함 진단을 위해 LLM 기반의 에이전트 워크플로를 활용하는 연구입니다. 증거 엔진과 전문 모듈을 통해 변이 우선순위를 지정하며, 기존 모델인 Exomiser 등을 능가하는 높은 Recall 성능을 입증했습니다.

ESAA-Conversational: 이기종 LLM 코딩 에이전트 간의 연속성, 핸드오프 및 큐레이션을 위한 이벤트 소싱 메모리 레이어

이기종 LLM 코딩 에이전트 간의 대화 상태 불일치 문제를 해결하기 위해 이벤트 소싱 기반의 메모리 레이어인 ESAA-Conversational을 제안합니다. 이 아키텍처는 대화 로그를 정규화된 이벤트 스토어로 관리하여 에이전트 간의 원활한 작업 인계와 협업을 지원합니다.

BluTrain: AI 시스템을 위한 C++/CUDA 프레임워크

BluTrain은 C++와 CUDA를 기반으로 설계된 고성능 AI 훈련 프레임워크입니다. 하드웨어 제어력을 극대화하면서도 시스템 복잡성을 추상화하여, PyTorch 대비 높은 처리량과 낮은 메모리 점유율을 제공합니다.

도메인 일반화(Domain Generalization)를 위한 인간 행동 인식(HAR)에서의 분포 변화(Distribution Shift) 평가

인간 행동 인식(HAR) 분야에서 장치 및 센서의 이질성으로 발생하는 분포 변화가 도메인 일반화에 미치는 영향을 체계적으로 분석한 연구입니다. 4가지 유형의 분포 변화를 평가하고, 기존 도메인 일반화 알고리즘의 한계를 드러내는 새로운 벤치마크를 제안합니다.

알기 위해 지불하기: 에이전트 기반 이커머스에서의 검증된 제품 정보를 위한 마이크로 트랜잭션 시장

에이전트 기반 이커머스 환경에서 신뢰할 수 있는 제품 정보를 확보하기 위한 마이크로 트랜잭션 시장 모델을 제안합니다. 자율 에이전트가 미세 결제를 통해 검증된 데이터를 구매함으로써, 단순 매칭을 넘어 정보의 신뢰성을 확보하는 새로운 아키텍처를 다룹니다.

VeriPilot: LLM 기반의 Verilog 디버깅 프레임워크

VeriPilot은 LLM을 활용하여 Verilog 설계의 버그를 자동으로 식별하고 수정하는 새로운 디버깅 프레임워크입니다. 골든 레퍼런스 모델과 제어-데이터 흐름 그래프(CDFG)를 결합하여 복잡한 의존성 체인을 추적함으로써 디버깅 정확도를 높였습니다.

Grad Detect: LLM의 그래디언트 기반 환각 탐지 (Gradient-Based Hallucination Detection in

LLM의 환각 현상을 탐지하기 위해 레이어별 그래디언트 패턴을 분석하는 Grad Detect 방법론을 제안합니다. 단 한 번의 순전파-역전파 과정을 통해 출력 신호만으로는 알 수 없는 내부 정보를 활용하여 환각 및 모델 기권 여부를 정확히 예측합니다.

EG-VQA: 근거가 있는 시간적 증거를 통한 검증 가능한 비디오 질의응답 벤치마킹

비디오 질의응답(VideoQA) 모델의 답변 근거를 검증하기 위한 새로운 벤치마크 EG-VQA를 제안합니다. 시간적 증거 주석을 통해 모델의 답변과 비디오 내용 간의 일치성을 평가하며, 이를 해결하기 위한 모델 EG-Reasoner를 선보입니다.

OrbitForge: 재구성 고정형 비디오 합성을 통한 텍text-to-3D 장면 생성

OrbitForge는 텍스트 기반 비디오 생성 모델을 활용하여 고품질의 3D Gaussian Splatting 장면을 생성하는 새로운 어댑터 기술입니다. 비디오의 시점 누락을 탐지하고 이를 보완하여 일관성 있는 3D 장면을 재구성함으로써 기존 방식의 한계를 극복합니다.

양방향 조건부 흐름 매칭(Bidirectional Conditional Flow Matching)을 이용한 카오스 시스템의 역문제 해결

양방향 조건부 흐름 매칭(Bi-CFM)을 활용하여 카오스 시스템의 역문제를 해결하는 새로운 연구를 소개합니다. 초기 상태와 최종 상태 간의 양방향 매핑을 통해 오차 누적을 완화하며, 보존 법칙을 준수하는 CBi-CFM을 통해 천체 역학 등 실제 복잡한 시스템에서도 높은 정확도를 입증했습니다.

구조화된 개념 진화(Structured Concept Evolution)를 통한 대규모 언어 모델(LLM)의 양자 LDPC 코드 발견

LLM과 구조화된 대수적 변이 문법을 결합한 SCE 프레임워크를 통해 새로운 양자 LDPC 코드를 발견하는 연구를 소개합니다. LLM이 직접 코드를 설계하는 대신 계층적 변이를 통해 대수적 사양을 진화시킴으로써 비아벨 군 기반의 경쟁력 있는 코드 패밀리를 찾아냈습니다.

채점자를 채점하기: 에이전트 기반 데이터 분석 시스템 평가로부터 얻은 교훈

에이전트 기반 데이터 분석 시스템의 복잡한 출력을 정확히 평가하기 위한 새로운 인간-AI 채점 캐스케이드 방법론을 제안합니다. LAMBDA 시스템을 통해 자동 채점기의 신뢰성을 검증하고, 채점 품질을 높이는 다양한 전략을 연구했습니다.

비기능적 요구사항(NFR) 평가를 위한 멀티턴 LLM 대화의 정확도 및 만족도

LLM 기반 대화형 어시스턴트의 비기능적 요구사항(NFR) 평가 방법론을 다룬 연구입니다. HIPAA 규제 준수 도메인을 대상으로 멀티턴 대화의 정확도와 사용자 만족도를 분석하여, 단순 기능적 정확성을 넘어선 새로운 평가 지표의 필요성을 제시합니다.

태스크와 목적의 매칭: 인코더-디코더 사전 학습 언어 모델을 위한 미세 조정(Fine-Tuning) 및 프롬프트

인코더-디코더 언어 모델의 성능을 극대화하기 위해 태스크와 사전 학습 목적 함수를 매칭하는 MTO 프레임워크를 제안합니다. 이 방식은 퓨샷 설정에서 기존 방식 대비 120% 이상의 성능 향상을 보이며, 프롬프트 튜닝 최적화에도 효과적입니다.

이 피드 구독하기

RSSFeedly, Inoreader 등으로 구독

API/api/search?q=검색어

AIllms.txt로 AI 크롤링 가이드

본 페이지의 콘텐츠는 AI가 공개된 소스를 기반으로 자동 수집·요약·번역한 것입니다. 원 저작권은 각 원저작자에게 있으며, 각 게시물의 “원문 바로가기” 링크를 통해 원문을 확인할 수 있습니다. 저작권자의 삭제 요청이 있을 경우 신속히 조치합니다.