본문으로 건너뛰기

© 2026 Molayo

Reddit요약2026. 05. 05. 01:06

오픈 웨이트 모델 명예의 전당

요약

이 기사는 대규모 언어 모델(LLM) 및 오픈 웨이트 AI 생태계의 주요 주역들을 소개하는 일종의 '명예의 전당'입니다. BERT, GPT-2, Llama 시리즈부터 Mistral, Qwen, Gemma 등 핵심적인 모델과 기술을 개발한 기업 및 연구자들, 그리고 vLLM, HuggingFace 같은 필수 인프라와 커뮤니티까지 광범위하게 다룹니다. 이는 현재 AI 분야의 발전이 소수 거대 기업뿐만 아니라 다양한 오픈소스 기여자들과 커뮤니티 주도 하에 이루어지고 있음을 강조합니다.

핵심 포인트

  • AI 생태계는 대기업(Google, Meta, OpenAI 등)과 독립적인 스타트업/연구자들(Mistral, DeepSeek, Qwen 등)이 협력하며 빠르게 성장하고 있습니다.
  • LLM의 발전은 모델 자체뿐만 아니라 PyTorch, NVIDIA GPU, vLLM, HuggingFace와 같은 핵심 인프라 및 도구에 크게 의존합니다.
  • 오픈소스 커뮤니티(LocalLLaMA, TheBloke 등)가 모델 양자화, 배포 환경 구축, 사용자 인터페이스 개선을 주도하며 접근성을 높이고 있습니다.
  • 다양한 전문 분야(의료 이미지, 코딩, 중국어권 특화 등)에 초점을 맞춘 세분화된 LLM들이 등장하고 있어 활용 범위가 넓어지고 있습니다.

"Attention is all you need" 논문 저자 (구글 근무 당시 작성)

2023 년 이전과 이후에 이 분야를 오랫동안 앞장서온 수많은 연구자들

BERT 저자

GPT2 저자

PyTorch 라이브러리를 만든 페이스북

ML 및 LLM 작업을 모두 가능하게 하는 최상위 성능 GPU 를 만든 NVIDIA

Llama 3.3 까지 모든 Llama 모델을 만든 메타

Mixtral 8x7B, Mistral Large, Mistral Medium 3.5 을 만든 미스트랄

Whisper 모델을 만들어 LLM 이 작동함을 증명하고, GPT-OSS-20B/120B 와 중국 오픈 웨이트 모델의 기반을 마련한 오픈AI

주류와 다른 것 (예: 의료 이미지 등) 에 집중하는 Gemma 모델을 만든 구글

DeepSeek-V2/V3/R1 및 V4 를 만든 딥시크

Qwen2.5-32B Coder, QwQ, Qwen3.x 를 특히 강조한 알리바바의 Qwen 모델

llama.cpp 팀 전체와 함께 이끄는 Georgi Gerganov 와 ikrakow 등 depart 한 사람들

vLLM 팀

TheBloke, bartowski, unsloth, mradermacher 와 수많은 쿼안트를 만든/만드는 사람들

모든 페타바이트 규모의 모델과 happiness 를 호스팅하고 transformers 라이브러리를 만든 HuggingFace

RAG 개념 저자

LocalLLaMA 커뮤니티!

기타 언급:

Kimi 2.x 모델을 만든 MoonshotAI

GLM 모델을 만든 Z-AI

Mac LLM 성능을 위한 MLX 커뮤니티

좋은 코딩 대안인 Minimax 모델을 만든 미니맥스

llama server 를 사용할 수 없는 사람들을 위한 LMStudio

TP 와 SillyTavern 을 위한 Turboderp 와 exllama3

OSS LLM 관리자를 만들기 위해 노력한 Open WebUI

AI 자동 생성 콘텐츠

본 콘텐츠는 Reddit AI Engineering의 원문을 AI가 자동으로 요약·번역·분석한 것입니다. 원 저작권은 원저작자에게 있으며, 정확한 내용은 반드시 원문을 확인해 주세요.

원문 바로가기
2

댓글

0