본문으로 건너뛰기

© 2026 Molayo

Reddit요약2026. 05. 22. 03:23

LLM 플래너 - 사용 사례/모델/예산에 맞는 하드웨어 구성을 선택하거나, 보유한 하드웨어에 맞는 모델을 선택하세요. 60개 이상의 빌드

요약

사용자의 예산과 사용 사례에 맞는 최적의 LLM 하드웨어 구성을 제안하거나, 보유한 하드웨어에 적합한 모델을 추천해 주는 가이드 사이트입니다. 60개 이상의 빌드 구성과 모델별 양자화 성능, 전력 소모량 등 상세한 벤치마크 데이터를 제공합니다.

핵심 포인트

  • 하드웨어 구매 및 모델 선택을 위한 양방향 가이드 제공
  • 양자화 수준별 토큰 생성 속도 및 프롬프트 처리 성능 데이터 포함
  • 전력 소모량, 가격, 실제 리뷰 영상 등 실질적인 구매 정보 연동
  • 오픈 웨이트 모델 중심의 하드웨어 적합성 순위 제공

요약(TL;DR): 인터넷 정보를 수집하여 LLM 모델/하드웨어 선택 가이드를 만들었습니다. 두 가지 방향이 있습니다:

  • "사용 사례 / 모델 / 예산에 따라 어떤 하드웨어(rig)를 구매해야 할까요?"
  • "저는 3090 / M3 Max / DGX Spark / Strix Halo / R9700을 가지고 있습니다. 무엇이 잘 돌아갈까요?"

또한 하드웨어와 LLM을 나란히 비교할 수 있는 비교 모드도 제공합니다. 초당 토큰 수(Tokens/sec) 수치는 출처를 인용하며, 모든 빌드에는 실제 리뷰어의 YouTube 영상 링크가 연결되어 있습니다.

제작 이유: 제가 무엇을 살지(5090, Spark 또는 Strix Halo) 결정해야 했습니다. 결국 ASUS에서 만든 Spark를 선택하게 되었습니다. 사이트를 벗어나 구글링을 할 필요가 없을 정도로 정보를 모으다 보니 제작하게 되었습니다.

실제 포함된 내용:

  • 온/오프 스위치로 조절 가능한 온갖 종류의 60개 이상의 구체적인 빌드 구성, 데이터 센터(datacentre) 온/오프 스위치
  • 모델별 Q2/Q4/Q5/Q8 양자화(quant) 시의 디코딩 토큰/초(Decode tok/s) + 프롬프트 처리 토큰/초(prompt-processing tok/s)
  • 첫 번째 토큰까지의 100K 프롬프트 처리 시간
  • 유휴(Idle) + 활성(active) 전력 소모량(와트 단위)
  • 중고 및 신품 가격, 다중 지역 지원
  • 빌드 전반에 걸쳐 연결된 150개 이상의 리뷰어 YouTube 영상 (리뷰를 보고 직접 의견을 결정할 수 있습니다)
  • 리더보드, 모델 카드(model cards), llama.cpp 벤치마크 스레드, Tom's Hardware 및 이 서브레딧(sub)에서 인용한 130개의 소스
  • 역방향 모드: 하드웨어 붙여넣기 -> 채팅/코딩/에이전트/추론 성능별로 순위가 매겨진 적합한 오픈 웨이트(open-weights) 모델 확인 (Closed-frontier 4종(Gemini 3.1 Pro, GPT-5.5, Sonnet 4.6, Opus 4.7)을 상한선 참조용으로 표시)
  • 데이터는 최소 일주일에 한 번 업데이트됩니다.

포함되지 않는 기능:

  • 귀하의 지역에서 가장 저렴한 가격에 대한 링크를 제공하지 않습니다.
  • 귀하의 하드웨어에서 얻을 수 있는 절대적인 최고 TPS를 제공하지 않습니다. 양자화(quant)/소프트웨어, 패치 및 업데이트에 따라 결과는 달라질 수 있습니다.

링크: https://llmrequirements.com

모든 데이터는 공개 리포지토리(public repo)로 내보내집니다.
https://github.com/Trenin-Labs/LlmRequirements
웹사이트에는 이 공개 리포지토리의 GitHub 이슈를 사용하여 벤치마크를 제출하거나 부정확한 정보를 보고할 수 있는 링크가 있습니다.

AI 자동 생성 콘텐츠

본 콘텐츠는 Reddit AI Engineering의 원문을 AI가 자동으로 요약·번역·분석한 것입니다. 원 저작권은 원저작자에게 있으며, 정확한 내용은 반드시 원문을 확인해 주세요.

원문 바로가기
0

댓글

0