요약 (TL;DR)

NVLink로 GPU 쌍(0↔2 및 1↔3)을 연결한 4× RTX 3090 환경에서, TP=2를 NVLinked 쌍에 고정하는 것이 PCIe를 통해 TP=2를 실행할 때보다 동시성(concurrency) 1에서 +25%의 처리량을, 그리고 동시성 4에서 **+53%**를 제공했습니다. 나머지 두 개의 GPU를 추가하여 TP=4로 만들면 성능이 좋아지지 않고 오히려 나빠졌습니다.

설정 (Setup)

하드웨어 (Hardware):

Insights

2x3090 NVLINK에서 Qwen 3.6 27B MTP 벤치마크

요약

핵심 포인트

설정 (Setup)

댓글

부동산 ETF 대결: Vanguard Real Estate ETF는 낮은 수수료를, FlexShares Global Quality REIT

Schnucks와 VitalityIP, Google Cloud 기반의 에이전틱 커머스 쇼핑 어시스턴트 출시

Ares Management의 2026년 2분기 실적: 예상 전망

Croc GUI: 터미널 없이 사용하는 암호화된 P2P 파일 전송 (크로스 플랫폼)

부동산 ETF 대결: Vanguard Real Estate ETF는 낮은 수수료를, FlexShares Global Quality REIT

Schnucks와 VitalityIP, Google Cloud 기반의 에이전틱 커머스 쇼핑 어시스턴트 출시

Ares Management의 2026년 2분기 실적: 예상 전망

Croc GUI: 터미널 없이 사용하는 암호화된 P2P 파일 전송 (크로스 플랫폼)