다양한 AI 머신들을 무료로 체험해 보세요
요약
다양한 로컬 AI 하드웨어의 성능을 직접 비교 체험할 수 있는 'AI 월드 페어' 웹사이트를 소개합니다. MacBook, Strix Halo, RTX 6000 등 다양한 머신의 추론 속도와 비디오 생성 성능을 비교할 수 있습니다.
핵심 포인트
- 다양한 로컬 AI 머신의 지연 시간 및 속도 비교 가능
- Qwen3-coder-next 모델을 활용한 추론 성능 테스트
- LTX2.3 기반의 AI 비디오 생성 기능 제공
- 홈 랩 환경의 전력 제한 및 병목 현상 주의 필요
사람들이 다양한 유형의 로컬 AI 머신들을 직접 만져보고, 비교하고, 시도해 볼 수 있도록 AI 월드 페어(AI Worlds Fair)를 위한 재미있는 웹사이트를 만들었습니다. M5 MacBook과 Strix Halo의 경주를 시키거나, RTX 6000과 GPT-5.5의 지연 시간(latency) 및 속도 등을 비교할 수 있습니다. 모든 머신은 대규모 그룹에 서비스하기 용이하고(3B active non thinking) 일반적인 추론(inference)에서 매우 좋은 결과를 보여주는 Qwen3-coder-next의 Q4 모델을 실행 중입니다.
또한 LTX2.3 등을 사용하여 비디오를 제작할 수도 있습니다.
이 모든 것은 저의 홈 랩(home lab)에서 구동되므로, 여러 사람이 통합 메모리(unified memory) 등에 동시에 요청을 보내거나 비디오를 동시에 생성하려고 할 때 발생할 수 있는 병목 현상(bottlenecks)은 염두에 두시기 바랍니다. 하지만 이를 공유하는 것이 멋진 일이 될 것 같고, 사람들이 머신과 출력물을 직접 비교하며 즐거워할 수도 있다고 생각했습니다.
휴대폰에서도 작동하며, 대규모 네트워킹 이벤트를 위해 제작되었기 때문에 약간의 홍보 내용이 포함되어 있습니다. 원래 그 목적으로 만들어졌지만, DGX Spark vs X 빌드를 경주시키고 경쟁하는 모습을 지켜보며 다양한 시도를 할 수 있다는 점이 멋지다고 생각하여 이곳에 공유합니다.
이벤트에서 누군가에게 보여줘야 할 일이 생기면 나중에 사이트를 내려야 할 수도 있지만, 여러분도 제가 즐기는 만큼 즐겁게 플레이하시길 바랍니다.
https://demo.osmanticcloud.com
빌드 및 설정 노트: 모든 구성은 “About the Lab” 링크에 있습니다. 2x Blackwell 타워는 다른 머신들이 동시에 실행될 때의 전기 부하를 감당하기 위해(필라델피아 아파트의 20A 차단기 사용 중) 추론 GPU 400W, 비디오 생성 GPU 400W로 전력을 제한했습니다. 비디오 생성을 600W로 작동시키면 비디오 생성 시간이 약 37초로 늘어나지만, 차단기가 내려갈 위험이 크게 높아집니다. 비디오 생성은 여러 요청을 쌓아둘 수 있지만, 당연히 사용자가 많아지면 가장 빠른 작업에 병목 현상이 발생합니다. 추론(Inference)은 안정적으로 유지됩니다.
submitted by /u/Signal_Ad657
[link] [comments]
AI 자동 생성 콘텐츠
본 콘텐츠는 r/LocalLLaMA의 원문을 AI가 자동으로 요약·번역·분석한 것입니다. 원 저작권은 원저작자에게 있으며, 정확한 내용은 반드시 원문을 확인해 주세요.
원문 바로가기