LLM 플래너 - 사용 사례/모델/예산에 맞는 하드웨어 구성을 선택하거나, 보유한 하드웨어에 맞는 모델을 선택하세요. 60개 이상의 빌드 - Insights | Molayo

요약(TL;DR): 인터넷 정보를 수집하여 LLM 모델/하드웨어 선택 가이드를 만들었습니다. 두 가지 방향이 있습니다:

"사용 사례 / 모델 / 예산에 따라 어떤 하드웨어(rig)를 구매해야 할까요?"
"저는 3090 / M3 Max / DGX Spark / Strix Halo / R9700을 가지고 있습니다. 무엇이 잘 돌아갈까요?"

또한 하드웨어와 LLM을 나란히 비교할 수 있는 비교 모드도 제공합니다. 초당 토큰 수(Tokens/sec) 수치는 출처를 인용하며, 모든 빌드에는 실제 리뷰어의 YouTube 영상 링크가 연결되어 있습니다.

제작 이유: 제가 무엇을 살지(5090, Spark 또는 Strix Halo) 결정해야 했습니다. 결국 ASUS에서 만든 Spark를 선택하게 되었습니다. 사이트를 벗어나 구글링을 할 필요가 없을 정도로 정보를 모으다 보니 제작하게 되었습니다.

실제 포함된 내용:

온/오프 스위치로 조절 가능한 온갖 종류의 60개 이상의 구체적인 빌드 구성, 데이터 센터(datacentre) 온/오프 스위치
모델별 Q2/Q4/Q5/Q8 양자화(quant) 시의 디코딩 토큰/초(Decode tok/s) + 프롬프트 처리 토큰/초(prompt-processing tok/s)
첫 번째 토큰까지의 100K 프롬프트 처리 시간
유휴(Idle) + 활성(active) 전력 소모량(와트 단위)
중고 및 신품 가격, 다중 지역 지원
빌드 전반에 걸쳐 연결된 150개 이상의 리뷰어 YouTube 영상 (리뷰를 보고 직접 의견을 결정할 수 있습니다)
리더보드, 모델 카드(model cards), llama.cpp 벤치마크 스레드, Tom's Hardware 및 이 서브레딧(sub)에서 인용한 130개의 소스
역방향 모드: 하드웨어 붙여넣기 -> 채팅/코딩/에이전트/추론 성능별로 순위가 매겨진 적합한 오픈 웨이트(open-weights) 모델 확인 (Closed-frontier 4종(Gemini 3.1 Pro, GPT-5.5, Sonnet 4.6, Opus 4.7)을 상한선 참조용으로 표시)
데이터는 최소 일주일에 한 번 업데이트됩니다.

포함되지 않는 기능:

귀하의 지역에서 가장 저렴한 가격에 대한 링크를 제공하지 않습니다.
귀하의 하드웨어에서 얻을 수 있는 절대적인 최고 TPS를 제공하지 않습니다. 양자화(quant)/소프트웨어, 패치 및 업데이트에 따라 결과는 달라질 수 있습니다.

링크: https://llmrequirements.com

모든 데이터는 공개 리포지토리(public repo)로 내보내집니다.
https://github.com/Trenin-Labs/LlmRequirements
웹사이트에는 이 공개 리포지토리의 GitHub 이슈를 사용하여 벤치마크를 제출하거나 부정확한 정보를 보고할 수 있는 링크가 있습니다.

Insights

LLM 플래너 - 사용 사례/모델/예산에 맞는 하드웨어 구성을 선택하거나, 보유한 하드웨어에 맞는 모델을 선택하세요. 60개 이상의 빌드

요약

핵심 포인트

댓글

모닝 비드: Alphabet 관련 소식

Solventum의 2026년 2분기 실적: 예상 사항

Ralph Lauren의 다음 분기 실적 발표에서 기대할 수 있는 것

AT&T, 번들 상품 수요 증가로 신규 무선 가입자 목표치 상회

모닝 비드: Alphabet 관련 소식

Solventum의 2026년 2분기 실적: 예상 사항

Ralph Lauren의 다음 분기 실적 발표에서 기대할 수 있는 것

AT&T, 번들 상품 수요 증가로 신규 무선 가입자 목표치 상회