Docker 是一個開源的應用容器引擎,可以輕松將應用程序打包成一個獨立的可移植的容器,從而實現輕松部署和管理。同時,Docker 還廣泛支持 GPU,可以幫助開發者將深度學習等工作負載分發到一組 GPU 上。
要使用 Docker 分配 GPU,請遵循以下步驟:
1. 首先,你需要安裝 nvidia-docker。
2. 接下來,使用 Dockerfile 創建一個鏡像,其中包含必要的 CUDA 和 CUDNN 庫,例如:
FROM nvidia/cuda:9.0-cudnn7-devel-ubuntu16.04
3. 然后,在 Dockerfile 中,你可以使用以下命令啟用 GPU:
ENV NVIDIA_VISIBLE_DEVICES all
ENV NVIDIA_DRIVER_CAPABILITIES compute,utility
這些命令將通過設定 NVIDIA_VISIBLE_DEVICES 環境變量來顯示所有可用的 GPU,并使用 NVIDIA_DRIVER_CAPABILITIES 告訴 Docker 容器要使用的 GPU 功能。
4. 最后,在運行 Docker 容器時,你需要使用以下命令來掛載 GPU:
docker run --gpus all
這將讓你的容器使用所有可用的 GPU。你還可以使用以下命令來指定要分配的 GPU 數目:
docker run --gpus '"device=1,2"'
這將讓你的容器使用第一個和第二個 GPU。
總之,Docker 提供了一種靈活而強大的方式來分配 GPU。使用上述步驟,你可以輕松地在 Docker 容器中分發深度學習等工作負載。