使用容器
CUDA使用旧的NGC基本容器建立的应用程序可能包含过时的储存库秘钥。假若您使用这种映像作为基础建立Docker容器,并更新packagemanager,或在Dockerfile中安装其他NVIDIA软件包,这种命令可能会失败,如同在非容器系统上一样。要解决此问题,请将原先的命令集成到用于建立容器的Dockerfile中。
未使用packagemanager安装更新的现有容器不受此秘钥轮换的影响。
与NVIDIAGPU营运商合作
倘若您是Ubuntu发行版上GPU操作符的当前用户,您可能会遭到CUDAGPG键旋转的影响,其中GPU操作符管理的一些容器可能难以启动,出现以下错误:
#f:2:4:d:a:2:1:1:d:a:0:1:e:d:8:4:c:0:f:c:8:e:8:b:9:8:1:a:6:0:d:5#
NVIDIA正在通过覆盖现有图象标签为驱动程序容器发布新图像。您可以通过更新现有clusterPolicy以获取新图像来解决此错误:
#1:0:4:9:9:b:d:9:1:2:d:b:0:1:f:b:3:8:3:a:c:4:4:9:6:9:2:3:3:1:e:3#
此步骤造成GPU操作员提取更新的图象。
GPU操作员的新安装应不受此修改的影响,但是不须要任何clusterPolicy更新。倘若您在RHEL或OpenShift上使用GPU运算符,您也不会遭到此修改的影响。
关于作者
RobArmstrong是CUDA工具包的主要技术产品总监。20多年来,他仍然专注于使用异构硬件平台加速软件,并对计算机体系结构和硬件/软件交互非常感兴趣。