K8s 환경에서 LLM 인프라 만지는 엔지니어들은 이 가이드북 구조를 참고해두면 좋을 듯. GPU Operator 활용부터 vLLM