Scaleway이 Hugging Face Inference Providers에 추가됨 🔥

요약

Scaleway이 Hugging Face Hub의 공식 Inference Provider로 추가되어 사용자들이 다양한 오픈 웨이트 모델에 더 쉽게 접근할 수 있게 되었습니다. 이 서비스를 통해 사용자들은 유럽 데이터 센터 기반의 안전한 인프라에서 경쟁력 있는 가격(토큰당 €0.20부터)으로 서버리스 추론을 이용할 수 있으며, 텍스트 및 이미지 처리는 물론 함수 호출 같은 고급 기능도 지원합니다. 개발자들은 Python/JS 클라이언트 SDK를 통해 Scaleway API 키 또는 Hugging Face 토큰을 사용하여 모델에 접근할 수 있습니다.

핵심 포인트

Scaleway이 Hugging Face Hub의 공식 Inference Provider로 통합되어 사용 편의성이 크게 향상되었습니다.
유럽 데이터 센터(파리) 기반으로, 유럽 사용자에게 데이터 주권과 낮은 지연 시간을 보장합니다.
경쟁력 있는 페어-퍼-토큰 가격($0.20부터 시작)으로 서버리스 추론을 제공하며, 텍스트/이미지 처리 및 함수 호출 등 고급 기능을 지원합니다.
개발자들은 Python 또는 JavaScript 클라이언트 SDK를 사용하여 Scaleway에 접근할 수 있으며, 자체 API 키 사용과 HF 라우팅 두 가지 방식을 지원합니다.

Scaleway가 이제 Hugging Face Hub 의 지원된 Inference Provider 가 되었습니다!

Scaleway 은 Hub 의 모델 페이지에서 직접 서버리스 추론 (serverless inference) 의 폭과 기능을 향상시키며 우리 생태계에 합류했습니다. Inference Providers 는 또한 JS 와 Python 양쪽의 클라이언트 SDK 에 완벽하게 통합되어 있어, 선호하는 제공업체와 다양한 모델을 사용하기가 매우 쉬워졌습니다.

이 출시를 통해 gpt-oss, Qwen3, DeepSeek R1, Gemma 3 와 같은 인기 있는 오픈 웨이트 (open-weight) 모델에 접근하는 것이 Hugging Face 에서 바로 더 쉬워졌습니다. Scaleway 의 org 를 Hub 에서 https://huggingface.co/scaleway 에서 검색하고, 트렌딩 지원된 모델을 https://huggingface.co/models?inference_provider=scaleway&sort=trending 에서 시도해 볼 수 있습니다.

Scaleway Generative APIs 는 간단한 API 호출을 통해 선도적인 연구 실험실에서 가장 최첨단 AI 모델에 접근할 수 있는 완전히 관리되는 서버리스 서비스입니다. 이 서비스는 토큰당 €0.20 부터 시작하는 경쟁력 있는 페어-퍼-토큰 (pay-per-token) 가격을 제공합니다.

이 서비스는 유럽 데이터 센터 (프랑스 파리) 에 위치한 안전한 인프라에서 실행되어, 유럽 사용자에게 데이터 주권과 낮은 지연 시간을 보장합니다. 플랫폼은 텍스트 및 이미지 처리를 위한 구조화된 출력, 함수 호출, 멀티모달 기능 등 고급 기능을 지원합니다.

생산 용도에 맞게 구축된 Scaleway 의 추론 인프라는 첫 토큰에 대해 200ms 이하의 응답 시간을 제공하여, 인터랙티브 애플리케이션과 에이전트 워크플로우 (agentic workflows) 에 이상적입니다. 이 서비스는 텍스트 생성 및 임베딩 모델을 모두 지원합니다. Scaleway 의 플랫폼 및 인프라에 대해 자세히 알아보세요: https://www.scaleway.com/en/generative-apis/.

Scaleway 을 Inference Provider 로 사용하는 방법에 대해 자세히 알아보려면 전용 문서 페이지를 참조하세요.

지원되는 모델 목록을 확인하세요.

사용자 계정 설정에서 다음 작업을 수행할 수 있습니다:
가입한 제공업체에 대한 자체 API 키를 설정합니다. 커스텀 키가 설정되지 않은 경우 요청은 HF 를 통해 라우팅됩니다.
선호도에 따라 제공업체 순서를 정렬합니다. 이는 모델 페이지의 위젯 및 코드 스니펫에도 적용됩니다.
앞서 언급한 바와 같이, Inference Provider 를 호출할 때 두 가지 모드가 있습니다:
커스텀 키 (요청이 해당 Inference Provider 의 자체 API 키를 사용하여 직접 제공업체로 이동합니다)
HF 로 라우팅 (이 경우 제공업체에서 토큰이 필요하지 않으며, 비용은 제공업체의 계정이 아닌 HF 계정에서 직접 부과됩니다)
모델 페이지는 세 번째_party 추론 제공업체 (현재 모델과 호환되는 제공업체를 선호도에 따라 정렬) 를 소개합니다.

다음 예제는 Scaleway 을 Inference Provider 로 사용하여 OpenAI 의 gpt-oss-120b 모델을 사용하는 방법을 보여줍니다. Hugging Face 토큰을 사용하여 Hugging Face 를 통해 자동 라우팅하거나, 해당 제공업체의 API 키가 있는 경우 자체 Scaleway API 키를 사용할 수 있습니다.

참고: 이는 최신 버전의 huggingface_hub 사용이 필요합니다 (>= 0.34.6).

import os
from huggingface_hub import InferenceClient
client = InferenceClient(
...

import { InferenceClient } from "@huggingface/inference";
const client = new InferenceClient(process.env.HF_TOKEN);
const chatCompletion = await client.chatCompletion({
...

여기서는 청구 방식이 설명됩니다:

직접 요청의 경우 (즉, 추론 제공업체에서 키를 사용할 때), 해당 제공업체에 의해 청구됩니다. 예를 들어 Scaleway API 키를 사용하면 Scaleway 계정에 청구됩니다.

라우팅된 요청의 경우 (즉, Hugging Face Hub 를 통해 인증할 때), 표준 제공업체 API 요금만 지불합니다. 우리는 추가 마진 (markup) 을 부과하지 않으며, 제공업체 비용을 직접 전달합니다. (앞으로 향후에는 파트너 제공업체와 수익 공유 계약을 체결할 수 있습니다.)

중요한 참고 사항 ‼️ PRO 사용자는 매월 $2 worth 의 추론 크레딧을 받습니다. 이를 모든 제공업체에서 사용할 수 있습니다. 🔥

우리는 또한 로그인한 무료 사용자에게 작은 할당량 (quota) 을 제공하는 무료 추론 서비스를 제공하지만, 가능하면 PRO 로 업그레이드하세요!

피드백을 원합니다! 의견 공유를 환영합니다.

AI 자동 생성 콘텐츠

원문 바로가기

Scaleway이 Hugging Face Inference Providers에 추가됨 🔥

요약

핵심 포인트

댓글