본문으로 건너뛰기

© 2026 Molayo

Insights

AI가 자동으로 큐레이션·번역·정리하는 기술 동향 피드입니다.

Hugging Face Blog 277필터 해제

HuggingFace헤드라인

Open ASR Leaderboard에 Benchmaxxer Repellant 추가

Open ASR Leaderboard는 벤치마킹의 신뢰성을 높이기 위해 Appen Inc. 및 DataoceanAI와 협력하여 다중 방언, 스크립트, 대화형 음성 데이터를 포함하는 고도화된 비공개 데이터셋을 추가했습니다. 이로써 모델이 특정 공개 테스트 세트에만 최적화되는 '벤치맥싱' 위험을 줄이고 실제 세계 성능을 더 잘 반영할 수 있게 되었습니다. 리더보드는 표준화(문장 부호/대소문자 제거 등)와 개방성(오픈 소스 스크립트)을 유지하면서도, 비공개 데이터셋의 영향을 통해 모델의 견고성을 평가하는 다차원적인 접근 방식을 제공합니다. 사용자들은 이제 다양한 조건별로 평균 WER 점수를 확인할 수 있습니다.

5월 6일10
HuggingFace헤드라인

Python 에서 Gradio 를 활용한 MCP 서버 구현: AI 쇼핑 어시스턴트

본 기사는 Gradio 라이브러리를 활용하여 강력한 MCP(Model Communication Protocol) 서버를 구현하고, 이를 통해 AI 기반의 쇼핑 어시스턴트 시스템을 구축하는 방법을 설명합니다. 핵심은 Gradio가 파이썬 함수를 LLM이 호출할 수 있는 도구로 자동 변환해주는 기능입니다. 이 기능을 이용해 가상 트라이온(Virtual Try-On) 모델(IDM-VTON)과 연동하여, 사용자가 온라인 쇼핑몰에서 옷을 검색하고 자신의 사진에 해당 의류를 입혀보는 AI 경험을 구현할 수 있습니다.

5월 6일11
HuggingFace헤드라인

Sentence Transformers 가 Hugging Face 에 합류합니다!

Sentence Transformers는 의미론적 임베딩 생성을 위한 핵심 오픈 소스 라이브러리로, 2019년 Nils Reimers에 의해 개발된 이래 NLP 연구 및 실무 분야에서 광범위하게 채택되어 왔습니다. 최근 Hugging Face Hub와 공식적으로 통합되면서 그 영향력이 더욱 커졌으며, 현재는 커뮤니티 주도 오픈 소스 프로젝트로서 지속적인 성장을 예고하고 있습니다.

5월 6일8
HuggingFace헤드라인

동의 기반 음성 클로닝: '음성 동의 게이트' 소개

본 글은 음성 클로닝 기술이 가진 잠재적 위험(딥페이크)을 인지하고, 이를 해결하기 위한 '음성 동의 게이트(voice consent gate)'라는 개념을 제안합니다. 이 시스템은 화자가 명시적으로 동의하는 문구를 말해야만 AI 모델이 해당 목소리를 복제하여 음성을 생성하도록 설계되었습니다. 이는 윤리적 원칙인 '동의'를 AI 워크플로우의 필수적인 기능적 전제 조건으로 통합함으로써, 기술의 투명성과 책임감을 높이는 것을 목표로 합니다.

5월 6일12
HuggingFace헤드라인

Flux 로 위한 Diffusers 와 PEFT 를 사용한 빠른 LoRA 추론

본 기사는 Flux 모델을 활용하여 LoRA(Low-Rank Adaptation) 기반 텍스트 생성 모델의 추론 속도를 최적화하는 방법을 다룹니다. 핵심은 `torch.compile`과 Flash Attention 3 (FA3), FP8 양자화 등의 기술을 결합하는 것입니다. 특히, 여러 LoRA 어댑터를 빠르게 교체(hotswap)하면서도 컴파일로 얻은 성능 이점을 유지하기 위해 `diffusers` 라이브러리의 `pipe.enable_lora_hotswap()` 기능을 활용하는 것이 중요합니다.

5월 5일7
HuggingFace헤드라인

Gradio MCP 서버로 LLM 능력 향상하기

본 기사는 Model Context Protocol (MCP)이라는 오픈 표준을 통해 대규모 언어 모델(LLM)의 기능을 확장하는 방법을 설명합니다. MCP는 LLM이 외부 도구 세트와 안전하게 양방향 연결할 수 있게 하며, 마치 스마트폰 앱 스토어에서 앱을 다운로드하듯 새로운 능력을 부여합니다. 특히 Hugging Face Spaces가 이러한 'MCP 앱 스토어' 역할을 수행하며, 사용자는 이곳에서 이미지 편집(예: Flux.1 Kontext[dev])과 같은 전문적인 기능을 LLM에 플러그인할 수 있습니다.

5월 5일9
HuggingFace헤드라인

연구를 위한 MCP: AI 를 연구 도구와 어떻게 연결할 것인가

본 기사는 AI를 활용한 '연구 발견(Research Discovery)' 과정을 혁신하는 Model Context Protocol (MCP)에 대해 설명합니다. 기존의 수동 검색이나 Python 스크립트 기반 자동화 방식은 비효율적이거나 오류가 많다는 한계가 있습니다. MCP는 이러한 연구 도구와 데이터 소스를 표준 프로토콜로 연결하여, AI가 자연어 요청만으로 여러 플랫폼을 조정하고 복잡한 정보 상호 참조를 수행할 수 있게 함으로써 연구 워크플로우의 추상화 수준을 높입니다.

5월 5일8
HuggingFace헤드라인

Claude 와 Hugging Face 로 이미지 생성하기

Anthropic의 Claude와 Hugging Face Spaces를 연결함으로써, 사용자들은 최첨단 AI 이미지 생성 모델들을 매우 쉽게 활용할 수 있게 되었습니다. 이 통합은 사용자가 전문적인 사진처럼 사실적이거나 텍스트가 포함된 고품질 이미지를 버튼 클릭만으로 생성하고 반복적으로 개선하는 것을 가능하게 합니다. 특히 Krea와 Qwen-Image 같은 최신 모델을 Claude를 통해 직접 호출하여, 각 모델의 강점(사실적 질감 vs. 정확한 텍스트 렌더링)에 따라 원하는 결과물을 얻을 수 있습니다.

5월 5일11
HuggingFace헤드라인

mmBERT: 다국어 모델이 현대 BERT 를 넘어선다

mmBERT는 1,800개 이상의 언어에 걸쳐 3조 토큰 이상으로 훈련된 최첨단 다국어 인코더 모델입니다. 이 모델은 ModernBERT의 효율적인 구조를 기반으로 하면서도, 세 단계에 걸친 체계적인 데이터 학습 전략과 점진적 언어 포함 방식을 도입하여 이전 모델 대비 성능 및 속도를 크게 향상시켰습니다. 특히 고품질 영어 콘텐츠와 광범위한 다국어 커버리지를 결합하고, 훈련 단계별로 마스크 비율을 조정하는 혁신적인 접근 방식을 통해 저자원 언어 학습 능력을 극대화했습니다.

5월 5일5
HuggingFace헤드라인

ScreenEnv: 전체 스택 데스크톱 에이전트 배포

ScreenEnv는 Docker 컨테이너 내에서 테스트 및 GUI 에이전트를 위한 격리된 Ubuntu 데스크톱 샌드박스 환경을 제공하는 강력한 Python 라이브러리입니다. 이 도구는 마우스/키보드 자동화, 애플리케이션 시작, 파일 처리 등 전체 데스크톱 경험을 완벽하게 제어할 수 있게 합니다. Model Context Protocol (MCP) 지원과 Docker 네이티브 배포 방식을 통해 복잡한 VM 설정 없이도 재현 가능하고 크로스 플랫폼(Linux, Android, macOS, Windows)인 AI 기반 데스크톱 에이전트 구축을 용이하게 합니다.

5월 5일12
HuggingFace헤드라인

Hugging Face 와 VirusTotal 이 협력하여 AI 보안 강화

Hugging Face가 세계적인 위협 정보 및 악성코드 분석 플랫폼인 VirusTotal과 협력하여 Hugging Face Hub에 공유되는 모든 파일의 보안을 대폭 강화합니다. 이 협력을 통해 2,200만 개 이상의 공개 모델 및 데이터셋 아티팩트가 지속적으로 스캔되며, 사용자가 파일을 다운로드하거나 통합하기 전에 해당 파일의 해시를 VirusTotal 데이터베이스와 비교하여 안전성 정보를 자동으로 제공받게 됩니다. 이는 AI 커뮤니티가 악성 또는 손상된 자산으로부터 더욱 안전하고 신뢰할 수 있는 환경에서 협업할 수 있도록 돕는 중요한 진전입니다.

5월 5일9
HuggingFace헤드라인

함께 오픈 에이전트 생태계를 구축합니다: OpenEnv 소개

본 기사는 자율적인 AI 에이전트 개발을 위한 표준화된 '에이전트 환경(Agent Environment)' 개념과 이를 구현한 OpenEnv 생태계를 소개합니다. OpenEnv는 에이전트가 작업을 수행하는 데 필요한 도구, API, 실행 컨텍스트 등을 안전하고 의미론적으로 명확하게 정의하는 샌드박스 역할을 합니다. Meta와 Hugging Face의 파트너십을 통해 구축된 이 환경 허브는 학습과 배포 전 과정에서 일관성을 제공하며, 개발자들이 쉽게 환경을 공유하고 재현할 수 있도록 지원합니다.

5월 5일7
HuggingFace헤드라인

Gradio MCP 서버에 대한 5 가지 주요 개선 사항

Gradio는 AI 기반 MCP(Model Communication Protocol) 서버 구축 및 호스팅에 있어 여러 가지 주요 개선 사항을 발표했습니다. 이번 업데이트를 통해 원격 파일 업로드 기능이 추가되어 에이전트가 직접 파일을 전송할 수 있게 되었으며, 실시간 진행 상태 알림 스트리밍 기능을 제공하여 사용자 경험을 향상시켰습니다. 또한, OpenAPI 스키마에서 Gradio 앱을 자동으로 생성하고, 백엔드 API를 한 줄의 코드로 MCP 도구에 통합하는 등 개발 편의성이 대폭 강화되었습니다.

5월 5일10
HuggingFace헤드라인

Hugging Face inference providers DeepInfra 🚀

Hugging Face가 DeepInfra를 공식 Inference Provider로 추가하여, 사용자들이 Hugging Face Hub의 모델 페이지에서 직접 서버리스 AI 추론 기능을 확장할 수 있게 되었습니다. 이를 통해 개발자들은 최소한의 설정으로 100개 이상의 다양한 오픈 웨이트 LLM(예: DeepSeek V4, Kimi-K2.6)을 애플리케이션에 통합할 수 있습니다. 이 기능은 Python 및 JavaScript SDK를 통해 원활하게 통합되며, 사용자는 자신의 API 키를 직접 사용하거나 Hugging Face 계정을 통해 라우팅하여 비용을 관리할 수 있습니다. DeepInfra는 경쟁력 있는 토큰 단가를 제공하는 서버리스 AI 추론 플랫폼이며, 현재 텍스트 생성 및 대화형 작업을 지원하며, 향후 이미지/비디오 등 더 많은 모달리티를 지원할 예정입니다. 또한, 이 기능은 Pi, OpenCode와 같은 다양한 Agent Harness에 통합되어 개발 편의성을 극대화합니다.

5월 5일11
HuggingFace헤드라인

무엇에 맞춰야 할까? MiniMax M2 의 에이전트 일반화 재고

LLM 에이전트 개발에서 벤치마크 성능과 실제 세계의 일반화 가능성 사이의 간극을 메우는 것이 핵심 과제입니다. 글쓴이는 M2를 설계하며, 단순히 높은 점수를 얻는 것보다 '야생(wild)' 환경에 견고하게 작동하는 에이전트를 만드는 데 집중했습니다. 이를 위해 에이전트가 임무 전반에 걸쳐 지속적으로 내부 독백(Interleaved Thinking)을 수행하도록 설계했는데, 이는 장기적인 일관성 유지와 외부 교란에 대한 적응력을 높이는 결정적인 요소입니다.

5월 5일11
HuggingFace헤드라인

NVIDIA Isaac 를 활용한 시뮬레이션에서 실제 배포까지 의료 로봇 구축 가이드

NVIDIA Isaac for Healthcare는 의료 로봇 개발의 데이터 격차와 복잡한 워크플로우 문제를 해결하는 통합 프레임워크입니다. 이 가이드는 NVIDIA Isaac을 활용하여 시뮬레이션에서 실제 하드웨어로 자율 수술 보조 로봇을 구축하고 검증하는 엔드투엔드 파이프라인(SO-ARM 시작 워크플로우)을 제시합니다. 이 워크플로우는 LeRobot으로 혼합된 시뮬레이션 및 실제 데이터를 수집하고, IsaacLab에서 모델을 훈련한 후, RTI DDS를 통해 물리적 하드웨어에 실시간으로 배포하는 3단계 과정을 포함하며, 이를 통해 개발자는 안전하고 반복 가능한 환경에서 로봇 시스템의 정교화가 가능합니다.

5월 5일10
HuggingFace헤드라인

Hugging Face 에서 NVIDIA NIM 을 활용한 LLM 가속화

NVIDIA NIM(NVIDIA Inference Microservice)을 활용하면 Hugging Face에 있는 10만 개 이상의 다양한 LLM을 빠르고 신뢰성 있게 배포할 수 있습니다. NIM은 단일 Docker 컨테이너 내에서 모델 분석, 아키텍처 및 양자화 감지, 최적의 추론 백엔드(TensorRT-LLM, vLLM, SGLang) 선택, 성능 설정을 자동화하여 복잡한 LLM 배포 과정을 단순화합니다. 사용자는 Hugging Face 체크포인트, GGUF, TensorRT-LLM 엔진 등 다양한 형식의 모델을 지원하며, 적절한 환경 설정과 Docker 명령어를 통해 쉽게 서비스를 구축할 수 있습니다.

5월 4일10
HuggingFace헤드라인

TimeScope: 비디오 대형 다중 모달 모델이 얼마나 오래 갈 수 있나요?

TimeScope는 시각 언어 모델(VLM)이 장시간 영상을 얼마나 깊이 있게 이해하는지 측정하기 위해 설계된 오픈소스 벤치마크입니다. 이 벤치마크는 1분에서 최대 8시간에 달하는 긴 기본 영상('haystack')에 짧은 '영상 클립'(needle)을 삽입하여, 모델의 국소화된 검색, 정보 합성, 미세한 시간적 인식 세 가지 핵심 능력을 평가합니다. TimeScope는 단순히 프레임 수를 늘리는 것만으로는 진정한 시간적 이해를 달성할 수 없으며, 전체 맥락에서 사건 순서와 역학을 추론하는 것이 중요함을 강조하며, 현존 모델들의 과장된 주장을 검증합니다.

5월 4일10
HuggingFace헤드라인

Trackio 소개: Hugging Face 의 경량 실험 추적 라이브러리

Trackio는 Hugging Face에서 개발한 경량 실험 추적(Experiment Tracking) 라이브러리로, 기존에 사용하던 `wandb`와 유사한 API를 제공합니다. 이 도구는 훈련 중 지표, 매개변수, 하이퍼파라미터 등을 로깅하고 시각화할 수 있게 해주며, 특히 결과를 Hugging Face Spaces에 쉽게 임베딩하거나 공유할 수 있다는 강력한 장점을 가집니다. Trackio의 주요 강점은 쉬운 공유성, 에너지 사용량 같은 환경 지표 추적을 통한 투명성 확보, 그리고 기록된 데이터의 높은 접근성을 제공한다는 점입니다. 이를 통해 연구자들은 복잡한 설정 없이도 효율적이고 협업하기 좋은 방식으로 머신러닝 실험을 관리할 수 있습니다.

5월 4일7
HuggingFace헤드라인

hf` 소개: 더 빠르고 친근한 Hugging Face CLI

Hugging Face CLI가 공식적으로 `huggingface-cli`에서 더 빠르고 사용하기 쉬운 `hf`로 이름이 변경되었습니다. 이 변화는 명령어 구조를 `hf <resource> <action>`이라는 예측 가능한 패턴으로 재구성하여 일관성과 명확성을 높였습니다. 주요 인증 명령어(`login`, `whoami`, `logout`)의 사용법도 업데이트되었으며, 새로운 기능인 클라우드 기반 작업 실행 서비스인 `hf jobs`가 추가되었습니다.

5월 4일7

이 피드 구독하기

본 페이지의 콘텐츠는 AI가 공개된 소스를 기반으로 자동 수집·요약·번역한 것입니다. 원 저작권은 각 원저작자에게 있으며, 각 게시물의 “원문 바로가기” 링크를 통해 원문을 확인할 수 있습니다. 저작권자의 삭제 요청이 있을 경우 신속히 조치합니다.