Kubernetes에서 GPU 환경 셋업하기
쿠버네티스에서 GPU 리소스를 효율적으로 활용하는 방법
GPU 쪼개기(time-slicing)
Deep Dive into Vector Databases by Hand ✍︎
ITMAYA
vLLM