본문으로 건너뛰기

© 2026 Molayo

HuggingFace헤드라인2026. 04. 24. 15:01

Hugging Face Inference Providers에 OVHcloud 지원 시작 🔥

요약

OVHcloud가 Hugging Face Hub의 공식 Inference Provider로 지원되면서, 개발자들이 더욱 다양한 오픈 웨이트(open-weight) 모델을 통합적으로 활용할 수 있게 되었습니다. 이 서비스는 유럽 데이터 센터에 위치하며 데이터 주권과 낮은 지연 시간을 보장합니다. 특히 €0.04/백만 토큰부터 시작하는 경쟁력 있는 가격 정책과, sub-200ms의 빠른 첫 토큰 응답 속도를 자랑하여 프로덕션 환경에 최적화되어 있습니다. JS 및 Python 클라이언트 SDK를 통해 간편하게 접근 가능하며, 사용자별 선

핵심 포인트

  • OVHcloud가 Hugging Face Hub Inference Provider로 공식 지원되며, gpt-oss, Qwen3, DeepSeek R1 등 주요 오픈 모델에 대한 접근성을 높였습니다.
  • 유럽 데이터 센터 기반의 서버리스(serverless) 서비스로 운영되어 데이터 주권(data sovereignty)을 보장하며, 유럽 사용자에게 낮은 지연 시간을 제공합니다.
  • 가격 경쟁력이 뛰어나며, API 호출당 €0.04/백만 토큰부터 시작하는 Pay-per-token 모델을 채택했습니다.
  • 프로덕션 사용에 최적화된 인프라를 갖추고 있으며, 첫 토큰 응답 시간(first token response time)이 sub-200ms로 매우 빠릅니다.

OVHcloud가 Hugging Face Hub의 지원되는 Inference Provider로 추가되었음을 기쁘게 알려드립니다! OVHcloud는 저희의 성장하는 생태계에 합류하여, Hub 모델 페이지에서 서버리스 추론(serverless inference)의 폭과 기능을 향상시킵니다. 또한, Inference Providers는 클라이언트 SDK(JS 및 Python용 모두)에도 원활하게 통합되어 있어, 선호하는 Provider를 통해 다양한 모델을 사용하는 것이 매우 쉬워졌습니다.

이번 출시로 gpt-oss, Qwen3, DeepSeek R1, Llama와 같은 인기 있는 오픈 웨이트(open-weight) 모델에 Hugging Face에서 바로 접근할 수 있게 되었습니다. OVHcloud의 Hub 조직 페이지는 https://huggingface.co/ovhcloud 에서 확인하실 수 있으며, 트렌딩되는 지원 모델은 https://huggingface.co/models?inference_provider=ovhcloud&sort=trending 에서 테스트해 보실 수 있습니다.

OVHcloud AI Endpoints는 주요 연구소의 최첨단 AI 모델에 간단한 API 호출을 통해 접근할 수 있는 완전 관리형(fully managed) 서버리스 서비스입니다. 이 서비스는 분당 100만 토큰당 €0.04부터 시작하는 경쟁력 있는 종량제(pay-per-token) 가격을 제공합니다.

이 서비스는 유럽 데이터 센터에 위치한 보안 인프라에서 실행되어, 데이터 주권(data sovereignty)과 유럽 사용자에게 낮은 지연 시간(low latency)을 보장합니다. 이 플랫폼은 구조화된 출력(structured outputs), 함수 호출(function calling), 그리고 텍스트 및 이미지 처리를 위한 멀티모달 기능(multimodal capabilities)을 포함한 고급 기능을 지원합니다.

프로덕션 사용에 맞춰 구축된 OVHcloud의 추론 인프라는 첫 토큰 응답 시간(first tokens response times)이 200ms 미만으로, 인터랙티브 애플리케이션 및 에이전트 워크플로우(agentic workflows)에 이상적입니다. 이 서비스는 텍스트 생성 모델과 임베딩 모델(embedding models)을 모두 지원합니다. OVHcloud의 플랫폼 및 인프라에 대한 자세한 내용은 https://www.ovhcloud.com/en/public-cloud/ai-endpoints/catalog/ 에서 확인하실 수 있습니다.

전용 문서 페이지에서 Inference Provider로 OVHcloud를 사용하는 방법에 대해 더 읽어보세요.
지원되는 모델 목록은 여기에서 확인하세요.

사용자 계정 설정에서는 다음을 할 수 있습니다:

  • 가입한 Provider에 대한 자체 API 키를 설정할 수 있습니다. 사용자 지정 키가 설정되지 않은 경우, 요청은 HF를 통해 라우팅됩니다.
  • 선호도 순으로 Provider를 정렬할 수 있습니다. 이는 모델 페이지의 위젯과 코드 스니펫(code snippets)에 적용됩니다.

언급했듯이, Inference Provider 호출 시 두 가지 모드가 있습니다:

  • 사용자 지정 키(Custom key): 추론 Provider로 직접 호출되며, 해당 추론 Provider의 자체 API 키를 사용합니다.
  • HF 라우팅(Routed by HF): 이 경우, Provider의 토큰이 필요하지 않으며, 요금은 Provider 계정이 아닌 귀하의 HF 계정에 직접 적용됩니다.

모델 페이지

AI 자동 생성 콘텐츠

본 콘텐츠는 Hugging Face Blog의 원문을 AI가 자동으로 요약·번역·분석한 것입니다. 원 저작권은 원저작자에게 있으며, 정확한 내용은 반드시 원문을 확인해 주세요.

원문 바로가기
7

댓글

0