M.2 어댑터와 사악한 ATX Y-splitter 케이블에 대한 약간의 분노 섞인 하소연
요약
멀티 GPU 환경을 구축하던 중 M.2 어댑터에 장착된 GPU가 vLLM에서 인식되지 않는 하드웨어 문제를 해결한 사례입니다. 원인은 ATX Y-splitter 케이블을 통한 전력 공유 문제였으며, 별도의 PSU를 추가하여 해결했습니다.
핵심 포인트
- 멀티 GPU 구성 시 전력 공급 안정성이 매우 중요함
- ATX Y-splitter 케이블 사용 시 전력 부족 문제 발생 가능
- vLLM 환경에서 GPU 인식 오류는 하드웨어 전력 문제일 수 있음
- 안정적인 시스템을 위해 GPU별 독립적인 PSU 사용 권장
하소연해서 죄송하지만, 제 좌절감을 공유해야겠어요 :) PCIe 5 x4 속도를 사용하는 쿼드 5060ti 설정(Finally - 4xRTX 5060TI : r/LocalLLaMA)을 거의 완성해가고 있었습니다. GPU burn도 작동했고, cpu-memtest와 nccl-tests도 통과했으며, 심지어 P2P 드라이버도 작동했습니다. 하지만 vllm이 M.2 어댑터에 장착된 두 개의 GPU를 PCIe 버스에서 그냥 튕겨내 버렸습니다. 한 번에 하나만 사용할 때는 잘 작동했습니다. 다른 드라이버, BIOS 설정, 심지어 다른 Linux 커널을 시도해 보았고, 하드웨어를 다른 위치로 교체하고 재장착도 해보았습니다. 완전히 미쳐버릴 것 같았습니다.
이 설정에는 2개의 PSU가 있었는데, 하나는 메인보드용이었고 다른 하나는 ATX Y-splitter를 사용하여 두 개의 M.2 어댑터와 공유하고 있었습니다. 결국 저는 대신 새 PSU를 추가해 보았습니다. 그랬더니 이제 씨발(?) 아주 잘 작동합니다. 제 자신에게 다소 짜증이 나서 그냥 공유해야 했습니다.
모든 보수적인 설정들을 원래대로 되돌리고 나면, 앞으로 며칠 내에 실제 벤치마크 결과와 함께 돌아오겠습니다.
수정: 참고로, 공유해서 사용하던 제 오래된 650w PSU의 문제였던 것 같습니다. 새로운 1000w PSU를 메인보드용으로 사용하고, 750w를 Y-splitter를 통해 공유하는 것도 잘 작동합니다... (https://www.reddit.com/r/LocalLLaMA/comments/1ubznim/comment/ot3w47q/?utm_source=share&utm_medium=web3x&utm_name=web3xcss&utm_term=1&utm_content=share_button 참조)
AI 자동 생성 콘텐츠
본 콘텐츠는 r/LocalLLaMA의 원문을 AI가 자동으로 요약·번역·분석한 것입니다. 원 저작권은 원저작자에게 있으며, 정확한 내용은 반드시 원문을 확인해 주세요.
원문 바로가기