๋ณธ๋ฌธ์œผ๋กœ ๊ฑด๋„ˆ๋›ฐ๊ธฐ

ยฉ 2026 Molayo

HuggingFaceํ—ค๋“œ๋ผ์ธ2026. 05. 05. 13:09

Hugging Face inference providers DeepInfra ๐Ÿš€

์š”์•ฝ

Hugging Face๊ฐ€ DeepInfra๋ฅผ ๊ณต์‹ Inference Provider๋กœ ์ถ”๊ฐ€ํ•˜์—ฌ, ์‚ฌ์šฉ์ž๋“ค์ด Hugging Face Hub์˜ ๋ชจ๋ธ ํŽ˜์ด์ง€์—์„œ ์ง์ ‘ ์„œ๋ฒ„๋ฆฌ์Šค AI ์ถ”๋ก  ๊ธฐ๋Šฅ์„ ํ™•์žฅํ•  ์ˆ˜ ์žˆ๊ฒŒ ๋˜์—ˆ์Šต๋‹ˆ๋‹ค. ์ด๋ฅผ ํ†ตํ•ด ๊ฐœ๋ฐœ์ž๋“ค์€ ์ตœ์†Œํ•œ์˜ ์„ค์ •์œผ๋กœ 100๊ฐœ ์ด์ƒ์˜ ๋‹ค์–‘ํ•œ ์˜คํ”ˆ ์›จ์ดํŠธ LLM(์˜ˆ: DeepSeek V4, Kimi-K2.6)์„ ์• ํ”Œ๋ฆฌ์ผ€์ด์…˜์— ํ†ตํ•ฉํ•  ์ˆ˜ ์žˆ์Šต๋‹ˆ๋‹ค. ์ด ๊ธฐ๋Šฅ์€ Python ๋ฐ JavaScript SDK๋ฅผ ํ†ตํ•ด ์›ํ™œํ•˜๊ฒŒ ํ†ตํ•ฉ๋˜๋ฉฐ, ์‚ฌ์šฉ์ž๋Š” ์ž์‹ ์˜ API ํ‚ค๋ฅผ ์ง์ ‘ ์‚ฌ์šฉํ•˜๊ฑฐ๋‚˜ Hugging Face ๊ณ„์ •์„ ํ†ตํ•ด ๋ผ์šฐํŒ…ํ•˜์—ฌ ๋น„์šฉ์„ ๊ด€๋ฆฌํ•  ์ˆ˜ ์žˆ์Šต๋‹ˆ๋‹ค. DeepInfra๋Š” ๊ฒฝ์Ÿ๋ ฅ ์žˆ๋Š” ํ† ํฐ ๋‹จ๊ฐ€๋ฅผ ์ œ๊ณตํ•˜๋Š” ์„œ๋ฒ„๋ฆฌ์Šค AI ์ถ”๋ก  ํ”Œ๋žซํผ์ด๋ฉฐ, ํ˜„์žฌ ํ…์ŠคํŠธ ์ƒ์„ฑ ๋ฐ ๋Œ€ํ™”ํ˜• ์ž‘์—…์„ ์ง€์›ํ•˜๋ฉฐ, ํ–ฅํ›„ ์ด๋ฏธ์ง€/๋น„๋””์˜ค ๋“ฑ ๋” ๋งŽ์€ ๋ชจ๋‹ฌ๋ฆฌํ‹ฐ๋ฅผ ์ง€์›ํ•  ์˜ˆ์ •์ž…๋‹ˆ๋‹ค. ๋˜ํ•œ, ์ด ๊ธฐ๋Šฅ์€ Pi, OpenCode์™€ ๊ฐ™์€ ๋‹ค์–‘ํ•œ Agent Harness์— ํ†ตํ•ฉ๋˜์–ด ๊ฐœ๋ฐœ ํŽธ์˜์„ฑ์„ ๊ทน๋Œ€ํ™”ํ•ฉ๋‹ˆ๋‹ค.

ํ•ต์‹ฌ ํฌ์ธํŠธ

  • DeepInfra๊ฐ€ Hugging Face Hub์˜ ๊ณต์‹ Inference Provider๋กœ ์ถ”๊ฐ€๋˜์—ˆ์Šต๋‹ˆ๋‹ค.
  • ๊ฐœ๋ฐœ์ž๋“ค์€ ์ตœ์†Œํ•œ์˜ ์„ค์ •์œผ๋กœ 100๊ฐœ ์ด์ƒ์˜ ์˜คํ”ˆ ์›จ์ดํŠธ LLM์„ ์„œ๋ฒ„๋ฆฌ์Šค ๋ฐฉ์‹์œผ๋กœ ์‚ฌ์šฉํ•  ์ˆ˜ ์žˆ์Šต๋‹ˆ๋‹ค.
  • ์ง€์›๋˜๋Š” ์ฃผ์š” ์ž‘์—… ์œ ํ˜•์€ ํ…์ŠคํŠธ ์ƒ์„ฑ, ๋Œ€ํ™”ํ˜• ์ถ”๋ก ์ด๋ฉฐ, ํ–ฅํ›„ ์ด๋ฏธ์ง€/๋น„๋””์˜ค ๋“ฑ ๋‹ค์–‘ํ•œ ๋ชจ๋‹ฌ๋ฆฌํ‹ฐ๊ฐ€ ํ™•์žฅ๋  ์˜ˆ์ •์ž…๋‹ˆ๋‹ค.
  • ์‚ฌ์šฉ์ž๋Š” ์ž์ฒด API ํ‚ค๋ฅผ ์‚ฌ์šฉํ•˜๊ฑฐ๋‚˜ Hugging Face Hub๋ฅผ ํ†ตํ•ด ๋ผ์šฐํŒ…ํ•˜์—ฌ ๋น„์šฉ ๋ฐ ์ธ์ฆ์„ ๊ด€๋ฆฌํ•  ์ˆ˜ ์žˆ์Šต๋‹ˆ๋‹ค.
  • Python (`huggingface_hub`) ๋ฐ JavaScript (`@huggingface/inference`) SDK๋ฅผ ํ†ตํ•ด ์‰ฝ๊ฒŒ ํ†ตํ•ฉ ๊ฐ€๋Šฅํ•˜๋ฉฐ, ๋‹ค์–‘ํ•œ Agent Harness์— ์ด๋ฏธ ํ†ตํ•ฉ๋˜์–ด ์žˆ์Šต๋‹ˆ๋‹ค.

์šฐ๋ฆฌ๋Š” Hugging Face Hub ์—์„œ DeepInfra ๊ฐ€ ์ด์ œ ์ง€์›๋˜๋Š” Inference Provider ๋กœ ์ถ”๊ฐ€๋˜์—ˆ๋‹ค๋Š” ์‚ฌ์‹ค์„ ๊ธฐ์˜๊ฒŒ ๊ณต์œ ํ•ฉ๋‹ˆ๋‹ค.

DeepInfra ๋Š” Hub ์˜ ๋ชจ๋ธ ํŽ˜์ด์ง€์—์„œ ์ง์ ‘ ์„œ๋ฒ„๋ฆฌ์Šค inference ๋ฅผ ํ™•์žฅํ•˜์—ฌ ์ƒํƒœ๊ณ„์˜ ํญ๊ณผ ๊ธฐ๋Šฅ์„ ํ–ฅ์ƒ์‹œ์ผฐ์Šต๋‹ˆ๋‹ค. Inference Providers ๋Š” ๋˜ํ•œ JS ์™€ Python ์„ ์œ„ํ•œ ํด๋ผ์ด์–ธํŠธ SDK ์— ์›ํ™œํ•˜๊ฒŒ ํ†ตํ•ฉ๋˜์–ด, ์„ ํ˜ธํ•˜๋Š” ์ œ๊ณต์—…์ฒด์™€ ๋‹ค์–‘ํ•œ ๋ชจ๋ธ์„ ์‚ฌ์šฉํ•˜๋„๋ก ๋งค์šฐ ์‰ฝ๊ฒŒ ๋งŒ๋“ค์—ˆ์Šต๋‹ˆ๋‹ค.

DeepInfra ๋Š” ์‚ฐ์—…๊ณ„์—์„œ ๊ฐ€์žฅ ๋น„์šฉ ํšจ์œจ์ ์ธ ํ† ํฐ ๋‹จ๊ฐ€ ์ค‘ ํ•˜๋‚˜๋ฅผ ์ œ๊ณตํ•˜๋Š” ์„œ๋ฒ„๋ฆฌ์Šค AI inference ํ”Œ๋žซํผ์ž…๋‹ˆ๋‹ค. 100 ๊ฐœ ์ด์ƒ์˜ ๋ชจ๋ธ ์นดํƒˆ๋กœ๊ทธ๋ฅผ ํ†ตํ•ด ๊ฐœ๋ฐœ์ž๊ฐ€ ์ตœ์†Œํ•œ์˜ ์„ค์ •์œผ๋กœ ๋‹ค์–‘ํ•œ AI ๊ธฐ๋Šฅ์„ ์• ํ”Œ๋ฆฌ์ผ€์ด์…˜์— ํ†ตํ•ฉํ•  ์ˆ˜ ์žˆ์Šต๋‹ˆ๋‹ค.

DeepInfra ๋Š” LLM ์—์„œ ํ…์ŠคํŠธ ์ƒ์„ฑ, ํ…์ŠคํŠธ-์ด๋ฏธ์ง€, ํ…์ŠคํŠธ-๋น„๋””์˜ค, ์ž„๋ฒ ๋”ฉ ๋ฐ ๋” ๋งŽ์€ ๊ด‘๋ฒ”์œ„ํ•œ ๋ชจ๋ธ ์œ ํ˜•์„ ์ง€์›ํ•ฉ๋‹ˆ๋‹ค. ์ด ์ดˆ๊ธฐ ํ†ตํ•ฉ์˜ ์ผํ™˜์œผ๋กœ DeepInfra ๋Š” Hugging Face ์—์„œ ๋Œ€ํ™”ํ˜• ๋ฐ ํ…์ŠคํŠธ ์ƒ์„ฑ ์ž‘์—… ์„ ์ง€์›ํ•˜์—ฌ DeepSeek V4, Kimi-K2.6, GLM-5.1 ๋“ฑ ์ธ๊ธฐ ์žˆ๋Š” ์˜คํ”ˆ ์›จ์ดํŠธ LLM ์— ๋Œ€ํ•œ ์•ก์„ธ์Šค๋ฅผ ๊ฐ€๋Šฅํ•˜๊ฒŒ ํ•ฉ๋‹ˆ๋‹ค. ์ถ”๊ฐ€ ์ž‘์—… ์ง€์›(ํ…์ŠคํŠธ-์ด๋ฏธ์ง€, ํ…์ŠคํŠธ-๋น„๋””์˜ค, ์ž„๋ฒ ๋”ฉ ๋ฐ ๋” ๋งŽ์€)์€ ๊ณง ์ถœ์‹œ๋  ์˜ˆ์ •์ž…๋‹ˆ๋‹ค!

DeepInfra ๋ฅผ Inference Provider ๋กœ ์‚ฌ์šฉํ•˜๋Š” ๋ฐฉ๋ฒ•์„ ์ž์„ธํžˆ ์ฝ์œผ๋ ค๋ฉด ์ „์šฉ ๋ฌธ์„œ ํŽ˜์ด์ง€๋ฅผ ์ฐธ์กฐํ•˜์„ธ์š”.

DeepInfra ๊ฐ€ ์ง€์›ํ•˜๋Š” ๋ชจ๋ธ์˜ ์ „์ฒด ๋ชฉ๋ก์„ ํ™•์ธํ•˜์„ธ์š”.

Hugging Face ์—์„œ DeepInfra ๋ฅผ ํŒ”๋กœ์šฐํ•˜์„ธ์š”: https://huggingface.co/DeepInfra.

  • ์‚ฌ์šฉ์ž ๊ณ„์ • ์„ค์ •์—์„œ ๋‹ค์Œ์„ ํ•  ์ˆ˜ ์žˆ์Šต๋‹ˆ๋‹ค:

  • ๋“ฑ๋กํ•œ ์ œ๊ณต์—…์ฒด์— ๋Œ€ํ•œ ์ž์ฒด API ํ‚ค๋ฅผ ์„ค์ •ํ•  ์ˆ˜ ์žˆ์Šต๋‹ˆ๋‹ค. ์ปค์Šคํ…€ ํ‚ค๊ฐ€ ์„ค์ •๋˜์ง€ ์•Š์€ ๊ฒฝ์šฐ ์š”์ฒญ์€ HF ๋กœ ๋ผ์šฐํŒ…๋ฉ๋‹ˆ๋‹ค.

  • ์„ ํ˜ธ๋„์— ๋”ฐ๋ผ ์ œ๊ณต์—…์ฒด๋ฅผ ์ •๋ ฌํ•ฉ๋‹ˆ๋‹ค. ์ด๋Š” ๋ชจ๋ธ ํŽ˜์ด์ง€์˜ ์œ„์ ฏ ๋ฐ ์ฝ”๋“œ ์Šค๋‹ˆํŽซ์—๋„ ์ ์šฉ๋ฉ๋‹ˆ๋‹ค.

  • Inference Provider ๋ฅผ ํ˜ธ์ถœํ•  ๋•Œ ๋‘ ๊ฐ€์ง€ ๋ชจ๋“œ๊ฐ€ ์žˆ์Šต๋‹ˆ๋‹ค:

  • ์ปค์Šคํ…€ ํ‚ค (์š”์ฒญ์ด ํ•ด๋‹น inference provider ์˜ ์ž์ฒด API ํ‚ค๋ฅผ ์‚ฌ์šฉํ•˜์—ฌ ์ง์ ‘ ์ธํ”„๋ผ์ด์…˜ ์ œ๊ณต์—…์ฒด๋กœ ์ด๋™ํ•ฉ๋‹ˆ๋‹ค)

  • HF ๋กœ ๋ผ์šฐํŒ… (์ด ๊ฒฝ์šฐ ์ œ๊ณต์—…์ฒด์—์„œ ํ† ํฐ์„ ํ•„์š”๋กœ ํ•˜์ง€ ์•Š์œผ๋ฉฐ, ๋น„์šฉ์€ ์ œ๊ณต์—…์ฒด์˜ ๊ณ„์ •์ด ์•„๋‹Œ HF ๊ณ„์ •์—์„œ ์ง์ ‘ ์ ์šฉ๋ฉ๋‹ˆ๋‹ค)

  • ๋ชจ๋ธ ํŽ˜์ด์ง€๋Š” ์„ธ ๋ฒˆ์งธ-party inference provider ๋ฅผ ์†Œ๊ฐœํ•ฉ๋‹ˆ๋‹ค (ํ˜„์žฌ ๋ชจ๋ธ๊ณผ ํ˜ธํ™˜๋˜๋Š” ๊ฒƒ๋“ค, ์‚ฌ์šฉ์ž ์„ ํ˜ธ๋„์— ๋”ฐ๋ผ ์ •๋ ฌ๋จ)

DeepInfra ๋Š” Hugging Face SDK ๋ฅผ ํ†ตํ•ด ์‚ฌ์šฉ ๊ฐ€๋Šฅํ•ฉ๋‹ˆ๋‹ค - huggingface_hub (Python) ๋ฐ @huggingface/inference (JavaScript).

๋‹ค์Œ ์˜ˆ์ œ๋Š” DeepSeek V4 Pro ๋ฅผ DeepInfra ๋ฅผ ํ†ตํ•ด ์‚ฌ์šฉํ•˜๋Š” ๋ฐฉ๋ฒ•์„ ๋ณด์—ฌ์ค๋‹ˆ๋‹ค. ์ธ์ฆ์„ ์œ„ํ•ด Hugging Face ํ† ํฐ์„ ์‚ฌ์šฉํ•˜๋ฉฐ, ์š”์ฒญ์€ ์ž๋™์œผ๋กœ DeepInfra ๋กœ ๋ผ์šฐํŒ…๋ฉ๋‹ˆ๋‹ค.

Hugging Face Inference Providers ๋Š” ๋Œ€๋ถ€๋ถ„์˜ Agent Harness ์— ํ†ตํ•ฉ๋˜์–ด ์žˆ์Šต๋‹ˆ๋‹ค - Pi, OpenCode, Hermes Agents, OpenClaw ๋“ฑ ํฌํ•จ. ์ด๋Š” ์ถ”๊ฐ€ ๊ธ€๋ฃจ ์ฝ”๋“œ ์—†์ด DeepInfra ํ˜ธ์ŠคํŒ… ๋ชจ๋ธ์„ ์ข‹์•„ํ•˜๋Š” ๋„๊ตฌ๋กœ ๋ฐ”๋กœ ํ”Œ๋Ÿฌ๊ทธํ•  ์ˆ˜ ์žˆ์Œ์„ ์˜๋ฏธํ•ฉ๋‹ˆ๋‹ค. ์ „์ฒด ํ†ตํ•ฉ ๋ชฉ๋ก์„ ํ™•์ธํ•˜์„ธ์š”.

import os
from openai import OpenAI
client = OpenAI(
...
import { OpenAI } from "openai";
const client = new OpenAI({
baseURL: "https://router.huggingface.co/v1",
...

์ง์ ‘ ์š”์ฒญ์˜ ๊ฒฝ์šฐ, ์ฆ‰ inference provider ์˜ ํ‚ค๋ฅผ ์‚ฌ์šฉํ•  ๋•Œ, ํ•ด๋‹น ์ œ๊ณต์—…์ฒด์— ์˜ํ•ด ์ฒญ๊ตฌ๋ฉ๋‹ˆ๋‹ค. ์˜ˆ๋ฅผ ๋“ค์–ด, DeepInfra API ํ‚ค๋ฅผ ์‚ฌ์šฉํ•˜๋ฉด DeepInfra ๊ณ„์ •์— ์ฒญ๊ตฌ๋ฉ๋‹ˆ๋‹ค.

๋ผ์šฐํŒ…๋œ ์š”์ฒญ์˜ ๊ฒฝ์šฐ, ์ฆ‰ Hugging Face Hub ๋ฅผ ํ†ตํ•ด ์ธ์ฆํ•  ๋•Œ, ํ‘œ์ค€ ์ œ๊ณต์—…์ฒด API ์š”๊ธˆ๋งŒ ์ง€๋ถˆํ•ฉ๋‹ˆ๋‹ค. ์šฐ๋ฆฌ๋Š” ์ถ”๊ฐ€ ๋งˆ์ง„์„ ๋ถ€๊ณผํ•˜์ง€ ์•Š์Šต๋‹ˆ๋‹ค; ์šฐ๋ฆฌ๋Š” ๋‹จ์ˆœํžˆ ์ œ๊ณต์—…์ฒด ๋น„์šฉ์„ ์ง์ ‘ ์ „๋‹ฌํ•ฉ๋‹ˆ๋‹ค. (๋ฏธ๋ž˜์—๋Š” ํŒŒํŠธ๋„ˆ ์ œ๊ณต์—…์ฒด์™€ ์ˆ˜์ต ๊ณต์œ  ๊ณ„์•ฝ์„ ์ฒด๊ฒฐํ•  ์ˆ˜ ์žˆ์Šต๋‹ˆ๋‹ค.)

์ค‘์š”ํ•œ ์ฐธ๊ณ ์‚ฌํ•ญ โ€ผ๏ธ PRO ์‚ฌ์šฉ์ž๋Š” ๋งค์›” $2 ๋ถ„๋Ÿ‰์˜ ์ถ”๋ก  ํฌ๋ ˆ๋”ง์„ ์ œ๊ณตํ•ฉ๋‹ˆ๋‹ค. ์ด๋ฅผ ๋‹ค์–‘ํ•œ ์ œ๊ณต์ž์—์„œ ์‚ฌ์šฉํ•  ์ˆ˜ ์žˆ์Šต๋‹ˆ๋‹ค. ๐Ÿ”ฅ

์šฐ๋ฆฌ๋Š” ๋กœ๊ทธ์ธ๋œ ๋ฌด๋ฃŒ ์‚ฌ์šฉ์ž๋“ค์—๊ฒŒ ์†Œ๋Ÿ‰ ํ• ๋‹น๋Ÿ‰์„ ์ œ๊ณตํ•˜์—ฌ ๋ฌด๋ฃŒ๋กœ ์ถ”๋ก  ์„œ๋น„์Šค๋ฅผ ์ œ๊ณตํ•˜์ง€๋งŒ, ๊ฐ€๋Šฅํ•˜๋‹ค๋ฉด PRO๋กœ ์—…๊ทธ๋ ˆ์ด๋“œํ•ด ์ฃผ์„ธ์š”!

๊ท€ํ•˜์˜ ํ”ผ๋“œ๋ฐฑ์„ ๋“ฃ๊ณ  ์‹ถ์Šต๋‹ˆ๋‹ค! ์˜๊ฒฌ๊ณผ/๋˜๋Š” ๋Œ“๊ธ€์„ ์—ฌ๊ธฐ์—์„œ ๊ณต์œ ํ•ด ์ฃผ์„ธ์š”: https://huggingface.co/spaces/huggingface/HuggingDiscussions/discussions/49

AI ์ž๋™ ์ƒ์„ฑ ์ฝ˜ํ…์ธ 

๋ณธ ์ฝ˜ํ…์ธ ๋Š” Hugging Face Blog์˜ ์›๋ฌธ์„ AI๊ฐ€ ์ž๋™์œผ๋กœ ์š”์•ฝยท๋ฒˆ์—ญยท๋ถ„์„ํ•œ ๊ฒƒ์ž…๋‹ˆ๋‹ค. ์› ์ €์ž‘๊ถŒ์€ ์›์ €์ž‘์ž์—๊ฒŒ ์žˆ์œผ๋ฉฐ, ์ •ํ™•ํ•œ ๋‚ด์šฉ์€ ๋ฐ˜๋“œ์‹œ ์›๋ฌธ์„ ํ™•์ธํ•ด ์ฃผ์„ธ์š”.

์›๋ฌธ ๋ฐ”๋กœ๊ฐ€๊ธฐ
1

๋Œ“๊ธ€

0