Hub ์ Fireworks.ai ํ์ ๐
์์ฝ
Fireworks.ai๊ฐ Hugging Face Hub์ ๊ณต์ ์ง์ Inference Provider๋ก ํฉ๋ฅํ์ต๋๋ค. ์ด๋ฅผ ํตํด ์ฌ์ฉ์๋ค์ HF ์ํ๊ณ ์ ๋ฐ์์ ๋ฒ๊ฐ ์๋์ ์๋ฒ๋ฆฌ์ค ์ถ๋ก ์ ๋์ฑ ์ฝ๊ฒ ์ด์ฉํ ์ ์๊ฒ ๋์์ต๋๋ค. ์ด์ DeepSeek-R1, Mistral-Small-24B ๋ฑ ๋ค์ํ ์ธ๊ธฐ ๋ชจ๋ธ๋ค์ Fireworks.ai๋ฅผ ํตํด ์๋ฒ๋ฆฌ์ค ๋ฐฉ์์ผ๋ก ์คํํ ์ ์์ผ๋ฉฐ, `huggingface_hub` ๋ผ์ด๋ธ๋ฌ๋ฆฌ๋ cURL ๋ช ๋ น์ด๋ฅผ ์ฌ์ฉํ์ฌ ํตํฉ์ ์ผ๋ก ์ ๊ทผํ๋ ๋ฐฉ๋ฒ์ ์๋ดํ๊ณ ์์ต๋๋ค.
ํต์ฌ ํฌ์ธํธ
- Fireworks.ai๊ฐ Hugging Face Hub์ ๊ณต์ ์ง์ Inference Provider๋ก ์ถ๊ฐ๋์์ต๋๋ค.
- ์ฌ์ฉ์๋ค์ HF ์ํ๊ณ ์ ๋ฐ์์ ์๋ฒ๋ฆฌ์ค ์ถ๋ก ์ ํตํด ๋ค์ํ ๋ชจ๋ธ(์: DeepSeek-R1, Llama-3.2)์ ์ ๊ทผํ ์ ์๊ฒ ๋์์ต๋๋ค.
- `huggingface_hub` ๋ผ์ด๋ธ๋ฌ๋ฆฌ๋ cURL ๋ช ๋ น์ด๋ฅผ ์ฌ์ฉํ์ฌ Fireworks.ai ์๋ํฌ์ธํธ๋ฅผ ํตํฉ์ ์ผ๋ก ํธ์ถํ๋ ๋ฐฉ๋ฒ์ ์ ๊ณตํฉ๋๋ค.
- Billing ๊ตฌ์กฐ๋ ์ฌ์ฉ์๊ฐ Hub๋ฅผ ํตํด ์ธ์ฆํ ๊ฒฝ์ฐ ํ์ค ์๊ธ๋ง ์ง๋ถํ๋ฉฐ, ์ง์ API ํค๋ฅผ ์ฌ์ฉํ ๊ฒฝ์ฐ Fireworks ๊ณ์ ์ ์ง์ ์ฒญ๊ตฌ๋ฉ๋๋ค.
Hub ์ Fireworks.ai ํ์ ๐
Fireworks.ai ๋ ์ด์ HF Hub ์ ์ง์๋ Inference Provider ๊ฐ ๋์์ต๋๋ค!
Fireworks.ai ๋ ๋ชจ๋ธ ํ์ด์ง ์ ์ฒด์์, ๊ทธ๋ฆฌ๊ณ HF ์ํ๊ณ์ ๋ผ์ด๋ธ๋ฌ๋ฆฌ ๋ฐ ๋๊ตฌ ์ ๋ฐ์ ๊ฑธ์ณ ๋ฒ๊ฐ ์๋์ ์๋ฒ๋ฆฌ์ค ์ถ๋ก ์ ์ ๊ณตํ์ฌ, ์ข์ํ๋ ๋ชจ๋ธ์์ ์ถ๋ก ์ ์คํํ๋ ๊ฒ์ ๋์ฑ ์ฝ๊ฒ ๋ง๋ญ๋๋ค.
๊ทธ ์ค์์๋ ์ด์ ๋ถํฐ Fireworks.ai ๋ฅผ ํตํด ๋ค์ ๋ชจ๋ธ์ ์๋ฒ๋ฆฌ์ค ์ถ๋ก ์ผ๋ก ์คํํ ์ ์์ต๋๋ค:
- deepseek-ai/DeepSeek-R1
- deepseek-ai/DeepSeek-V3
- mistralai/Mistral-Small-24B-Instruct-2501
- Qwen/Qwen2.5-Coder-32B-Instruct
- meta-llama/Llama-3.2-90B-Vision-Instruct
๊ทธ๋ฆฌ๊ณ ๋ ๋ง์ ๋ชจ๋ธ์ ์ฌ๊ธฐ์์ ์ฐพ์ ์ ์์ต๋๋ค.
์ค๋ Fireworks.ai ๋ก ํ๋ก์ ํธ๋ฅผ ุฑูุดู ํ์ธ์!
HF ์์ Fireworks ์ด ์ง์ํ๋ ๋ชจ๋ ๋ชจ๋ธ์ ์ฌ๊ธฐ์์ ๊ฒ์ํ์ธ์.
๋ค์ ์์๋ Fireworks.ai ๋ฅผ ์ถ๋ก ์ ๊ณต์๋ก ์ฌ์ฉํ์ฌ DeepSeek-R1 ์ ์ฌ์ฉํ๋ ๋ฐฉ๋ฒ์ ๋ณด์ฌ์ค๋๋ค. Hugging Face ํ ํฐ์ ์ฌ์ฉํ์ฌ Hugging Face ๋ฅผ ํตํ ์๋ ๋ผ์ฐํ ์ ์ฌ์ฉํ ์ ์๊ฑฐ๋, Fireworks.ai API ํค๊ฐ ์๋ ๊ฒฝ์ฐ ์์ฒด ํค๋ฅผ ์ฌ์ฉํ ์ ์์ต๋๋ค.
huggingface_hub ์ค์น
์์ค:
pip install git+https://github.com/huggingface/huggingface_hub
provider ๋งค๊ฐ๋ณ์๋ฅผ ์ ์ํ์ฌ huggingface_hub Python ๋ผ์ด๋ธ๋ฌ๋ฆฌ๋ฅผ ์ฌ์ฉํ์ฌ Fireworks.ai ์๋ํฌ์ธํธ๋ฅผ ํธ์ถํฉ๋๋ค.
from huggingface_hub import InferenceClient
client = InferenceClient(
provider="fireworks-ai",
...
import { HfInference } from "@huggingface/inference";
const client = new HfInference("xxxxxxxxxxxxxxxxxxxxxxxx");
const chatCompletion = await client.chatCompletion({
...
๋ค์์ Fireworks.ai ๋ฅผ ์ถ๋ก ์ ๊ณต์๋ก ์ฌ์ฉํ์ฌ cURL ๋ก Llama-3.3-70B-Instruct ์ ํธ์ถํ๋ ๋ฐฉ๋ฒ์ ๋๋ค.
curl 'https://router.huggingface.co/fireworks-ai/v1/chat/completions' \
-H 'Authorization: Bearer xxxxxxxxxxxxxxxxxxxxxxxx' \
-H 'Content-Type: application/json' \
...
์ง์ ์์ฒญ์ ๊ฒฝ์ฐ, ์ฆ Fireworks ํค๋ฅผ ์ฌ์ฉํ ๋, billing ์ Fireworks ๊ณ์ ์ ์ง์ ๋ฐ์ํฉ๋๋ค.
๋ผ์ฐํ ๋ ์์ฒญ์ ๊ฒฝ์ฐ, ์ฆ Hub ๋ฅผ ํตํด ์ธ์ฆํ ๋, ํ์ค Fireworks API ์๊ธ๋ง ์ง๋ถํฉ๋๋ค. ์ถ๊ฐ ๋งํฌ์ ์ ์์ต๋๋ค. ์ฐ๋ฆฌ๋ ์ ๊ณต์ ๋น์ฉ์ ์ง์ ์ ๋ฌํ๊ธฐ ๋๋ฌธ์ ๋๋ค. (๋ฏธ๋์๋ ์ฐ๋ฆฌ ์ ๊ณต์ ํํธ๋์ ์์ต ๊ณต์ ๊ณ์ฝ์ ์ฒด๊ฒฐํ ์ ์์ต๋๋ค.)
์ค์ํ ์ฃผ์์ฌํญ โผ๏ธ PRO ์ฌ์ฉ์๋ ๋งค๋ฌ ์ถ๋ก ํฌ๋ ๋ง $2 ๋ฅผ ๋ฐ์ต๋๋ค. ์ฌ๋ฌ ์ ๊ณต์๋ก ์ฌ์ฉํ ์ ์์ต๋๋ค. ๐ฅ
AI ์๋ ์์ฑ ์ฝํ ์ธ
๋ณธ ์ฝํ ์ธ ๋ Hugging Face Blog์ ์๋ฌธ์ AI๊ฐ ์๋์ผ๋ก ์์ฝยท๋ฒ์ญยท๋ถ์ํ ๊ฒ์ ๋๋ค. ์ ์ ์๊ถ์ ์์ ์์์๊ฒ ์์ผ๋ฉฐ, ์ ํํ ๋ด์ฉ์ ๋ฐ๋์ ์๋ฌธ์ ํ์ธํด ์ฃผ์ธ์.
์๋ฌธ ๋ฐ๋ก๊ฐ๊ธฐ