본문으로 건너뛰기

© 2026 Molayo

Insights

AI가 자동으로 큐레이션·번역·정리하는 기술 동향 피드입니다.

X @huggingpapers (검증됨) 164필터 해제

X요약

NVIDIA가 Hugging Face에 PCB 이상 탐지 데이터셋을 공개했습니다

NVIDIA가 Hugging Face를 통해 FoxConn 공장의 NV 보드에서 추출한 PCB 이상 탐지 데이터셋을 공개했습니다. 이 데이터셋은 AnomalyGen 및 Qwen-Image-Edit의 파인튜닝과 합성 결함 생성 연구를 목적으로 합니다.

2시간 전1
X요약

NVIDIA가 Hugging Face에 Spark AnomalyGen을 출시했습니다

NVIDIA가 Hugging Face에 PCB 결함 생성을 위한 Spark AnomalyGen을 출시했습니다. OpenUSD 기반의 3D 장면을 활용하여 현실적인 구조적 결함을 합성하며, 소량의 데이터로도 시각 검사 모델 학습을 지원합니다.

2시간 전0
X요약

NVIDIA PiD, 디코딩(Decoding)과 초해상도(Super-resolution)를 하나의 생성 패스(Generative pass)로

NVIDIA가 디코딩과 초해상도를 단일 생성 패스로 통합한 PiD 모델을 공개했습니다. 기존 파이프라인보다 6배 빠르며 소비자용 GPU에서 1초 미만으로 실행되어 효율적인 이미지 생성이 가능합니다.

3시간 전0
X요약

ResearchMath-14K

멀티 에이전트 파이프라인을 통해 수집된 14,056개의 대규모 수학 문제 데이터셋인 ResearchMath-14K를 소개합니다. 이 데이터셋은 Qwen3 모델의 수학적 추론 성능을 9.2포인트 향상시켰으며, 정답 없이도 추론 감독이 가능함을 입증했습니다.

7시간 전0
X요약

ResearchMath-14K: 14,000개의 오픈 연구 수준 수학 문제

에이전트가 학술적 출처에서 큐레이션한 14,000개의 오픈 수학 문제 데이터셋인 ResearchMath-14K를 소개합니다. 이 데이터셋은 220,000개의 추론 흔적을 포함하며, Qwen3 모델의 성능을 9.2포인트 향상시키는 효과를 입증했습니다.

11시간 전0
X요약

minWM: 실시간 상호작용형 비디오 월드 모델을 위한 최초의 풀스택 오픈소스 프레임워크

실시간 상호작용이 가능한 비디오 월드 모델을 위한 최초의 풀스택 오픈소스 프레임워크인 minWM을 소개합니다. 양방향 확산 기술을 활용해 4단계만으로 카메라 제어가 가능한 환경을 구축합니다.

14시간 전0
X요약

NVIDIA, Hugging Face에 PCB 이상 생성 모델 출시

NVIDIA가 Hugging Face에 PCB 결함을 생성하는 모델과 양자화된 Qwen3.6 MoE 모델을 출시했습니다. PCB 모델은 소량의 데이터로도 시각 검사 학습이 가능하며, Qwen 모델은 NVFP4 기술을 통해 메모리 사용량을 획기적으로 줄였습니다.

18시간 전0
X요약

CollectionLoRA: 50가지 효과를 하나의 LoRA로 증류

Alibaba 연구진이 개발한 CollectionLoRA는 50가지의 다양한 효과를 단 하나의 LoRA로 증류하는 기술입니다. 멀티 티처 온폴리시 증류 방식을 통해 서빙 비용을 절감하고 효과 간 간섭을 제거하며, 추론 시 제로샷 조합이 가능합니다.

19시간 전0
X요약

Alibaba의 Qwen-VLA 출시

Alibaba가 다양한 형태의 로봇 컨트롤러로 활용 가능한 통합 시각-언어-행동(VLA) 모델인 Qwen-VLA를 출시했습니다. 이 모델은 별도의 미세 조정 없이도 조작, 내비게이션 등 특정 작업에서 기존 전문가 모델들을 능가하는 성능을 보여줍니다.

22시간 전0
X요약

NVIDIA가 Hugging Face에 양자화된 Qwen3.6 MoE 모델을 출시했습니다

NVIDIA가 Hugging Face를 통해 양자화된 Qwen3.6 MoE 모델과 최적화된 Kokoro TTS 모델을 출시했습니다. Qwen3.6 모델은 NVFP4 기술을 통해 메모리를 3배 절감하며 멀티모달 입력을 지원합니다.

22시간 전1
X요약

NVIDIA가 Hugging Face에 dvlt를 출시했습니다

NVIDIA가 Hugging Face를 통해 새로운 연구 체크포인트인 dvlt를 출시했습니다. 이는 ONNX Runtime을 활용해 NVIDIA GPU에서 빠르게 실행되는 82M 파라미터 규모의 경량 Kokoro TTS 모델입니다.

23시간 전0
X요약

Tencent, Hugging Face에 PlanningBench 공개

Tencent가 LLM의 계획 수립 능력을 평가하기 위한 벤치마크인 PlanningBench를 Hugging Face에 공개했습니다. 또한 NVIDIA는 ONNX Runtime을 통해 GPU에서 빠르게 실행 가능한 경량 Kokoro TTS 모델을 공개했습니다.

1일 전0
X요약

OmniRetrieval

OmniRetrieval은 텍스트, SQL, RDF, 프로퍼티 그래프 등 다양한 형식의 지식을 각 방식에 맞춰 처리하는 통합 검색기입니다. 13개 데이터셋과 309개의 지식 베이스를 대상으로 자연어 라우팅을 수행합니다.

1일 전1
X요약

NVIDIA가 Hugging Face에 최적화된 Kokoro TTS 모델 버전을 출시했습니다

NVIDIA가 Hugging Face용으로 최적화된 경량 Kokoro TTS 모델을 출시했습니다. 또한, 장기 추론 성능을 높이기 위해 신념 상태를 최적화하는 BeliefTrack 기술을 소개하며 추론 실패율을 70% 이상 개선했습니다.

1일 전1
X요약

AgentDoG 1.5

AgentDoG 1.5는 AI 에이전트의 안전성을 위한 경량화 및 확장 가능한 정렬 프레임워크입니다. 단 1k개의 샘플만으로도 소규모 모델이 선도적인 폐쇄형 시스템과 대등한 성능을 내며, BeliefTrack을 통해 추론 실패를 70% 이상 줄였습니다.

1일 전0
X요약

LLM은 언제 정보를 업데이트, 보존 또는 무시해야 하는가?

LLM의 장기 추론 능력을 향상시키기 위한 맥락적 신념 관리(Contextual Belief Management) 연구를 소개합니다. BeliefTrack을 통해 신념 상태를 최적화함으로써 추론 실패를 70% 이상 줄일 수 있음을 입증했습니다.

1일 전1
X요약

Tencent이 Hugging Face에 DiffSpot을 출시했습니다

Tencent이 웹 스크린샷 간의 미세한 CSS 변경 사항을 탐지하는 벤치마크인 DiffSpot을 Hugging Face에 출시했습니다. 현재 최신 모델들도 미세한 변화를 포착하는 데 어려움을 겪고 있음을 보여줍니다.

1일 전0
X요약

비디오 생성은 아직 세계 모델링(World Modeling)이 아니다

비디오 확산 모델이 시간의 흐름은 모사하지만 실제 세계의 인과 관계를 이해하는 '세계 모델링'에는 한계가 있음을 지적합니다. YoCausal 연구를 통해 13개 모델의 인과적 인지 능력을 평가하고, LLM의 자기 개선을 위한 새로운 탐색 프레임워크를 제안합니다.

1일 전0
X요약

DenoiseRL: 실패로부터 회복하며 추론하는 법 배우기

DenoiseRL은 강화학습 모델이 실수를 학습 신호로 활용하여 스스로 회복하는 새로운 프레임워크입니다. 강력한 교사 모델 없이도 손상된 추론 접두사를 노이즈 제거하며 올바른 경로를 찾는 법을 학습합니다.

1일 전0
X요약

양방향 진화 탐색을 통한 자기 개선 LLM (Self-Improving LLMs with Bidirectional Evolutionary

양방향 진화 탐색(BES)은 후보군 진화와 목표 분해를 결합하여 LLM의 사후 학습 및 추론 성능을 개선하는 프레임워크입니다. 좁은 엔트로피 껍질을 탈피하고 조밀한 중간 피드백을 제공하는 것이 특징입니다.

1일 전0

이 피드 구독하기

본 페이지의 콘텐츠는 AI가 공개된 소스를 기반으로 자동 수집·요약·번역한 것입니다. 원 저작권은 각 원저작자에게 있으며, 각 게시물의 “원문 바로가기” 링크를 통해 원문을 확인할 수 있습니다. 저작권자의 삭제 요청이 있을 경우 신속히 조치합니다.