Kubernetes GPU共享实践

环境准备

1. GPU 节点准备

GPU共享依赖NVIDIA驱动和nvidia-docker2,需要事先安装。NVIDIA驱动安装参考nvidia-docker

  • NVIDIA驱动和nvidia-docker2安装
# 如果已安装nvidia-docker,需要先进行卸载
>$ docker volume ls -q -f driver=nvidia-docker | xargs -r -I{} -n1 docker ps -q -a -f volume={} | xargs -r docker rm -f
>$ sudo yum remove nvidia-docker -y

# 安装nvidia-docker2 repo
distribution=$(. /etc/os-release;echo $ID$VERSION_ID)
curl -s -L https://nvidia.github.io/nvidia-docker/$distribution/nvidia-docker.repo | \
 >$ sudo tee /etc/yum.repos.d/nvidia-docker.repo

# 安装nvidia-docker,并重新加载docker配置
>$ sudo yum install -y nvidia-docker2
>$ sudo pkill -SIGHUP dockerd

# 在cuda:9.0容器中测试nvidia-smi命令
>$ docker run --runtime=nvidia --rm nvidia/cuda:9.0-base nvidia-smi
  • 设置NVIDIA runtime为docker默认运行时环境

编辑docker daemon config文件,没有则创建一个。
文件路径:/etc/docker/daemon.json
文件内容:

{
    "default-runtime": "nvidia",
    "runtimes": {
        "nvidia": {
           "path": "/usr/bin/nvidia-container-runtime",
           "runtimeArgs": []
      }
   }
}

2. 部署GPU share scheduler

  • 从git 仓库clone gpushare-scheduler-extender项目到本地
  • 进入项目config目录下,将scheduler-policy-config.json文件复制到k8s master节点的/etc/kubernetes/目录下。
  • 在kubernetes上部署gpushare-schd-extender。复制config目录下的gpushare-schd-extender.yaml文件到kubernetes 集群mater节点,执行kubectl apply -f gpushare-schd-extender.yaml命令,完成gpushare-schd-extender部署。

3. 修改调度器配置

修改调度器配置,其目的是将scheduler-policy-config.json加入到默认的调度器配置中(/etc/kubernetes/manifests/kube-scheduler.yaml)。
第一步:在调度程序参数中添加策略配置文件参数

- --policy-config-file=/etc/kubernetes/scheduler-policy-config.json

第二步:挂载卷到Pod 的Spec中

- mountPath: /etc/kubernetes/scheduler-policy-config.json
  name: scheduler-policy-config
  readOnly: true
- hostPath:
      path: /etc/kubernetes/scheduler-policy-config.json
      type: FileOrCreate
  name: scheduler-policy-config

如果在此之前未对调度器做过任何修改和配置,也可以直接使用config目录下的kube-scheduler.yaml(复制该文件到/etc/Kubernetes/manifest即可)。

⚠️ 注意:

如果Kubernetes默认调度程序部署为静态pod,不要在/etc/Kubernetes/manifest中编辑yaml文件。需要提前在/etc/kubernetes/manifest目录之外编辑好yaml文件。然后将编辑好的yaml文件复制到/etc/kubernetes/manifest/目录,然后kubernetes将自动用yaml文件更新默认的静态pod。

4. 部署Device Plugin

  • 从git仓库clone项目gpushare-device-plugin到本地。
  • 复制根目录下的device-plugin-rbac.yamldevice-plugin-ds.yaml到master节点,执行kubectl apply -f device-plugin-rbac.yamlkubectl apply -f device-plugin-ds.yaml命令完成部署。

⚠️ 注意:

在部署之前需要删除默认的GPU Device Plugin。例如,如果当前使用的是nvidia-device-Plugin,则需要执行kubectl delete ds -n kube-system nvidia-device-plugin-daemonset删除默认GPU Device Plugin。

5.将gpushare节点标签添加到需要GPU共享的节点

添加标签gpushare=true到需要要安装device plugin(需要共享GPU)的所有节点。

>$ kubectl label node <target_node> gpushare=true

6.升级kubectl扩展工具

  • 下载kubectl-inspect-gpushare到本地
>$ wget https://github.com/AliyunContainerService/gpushare-device-plugin/releases/download/v0.3.0/kubectl-inspect-gpushare
  • 在k8s master节点上安装kubectl-inspect-gpushare
    复制kubectl-inspect-gpushare/usr/bin目录下并添加可执行权限。
>$ chmod u+x /usr/bin/kubectl-inspect-gpushare

⚠️ 注意:

如果你的kubectl版本低于kubectl 1.12,需要先升级kubectl.

服务部署和使用

1.查询共享GPU显存分配情况

>$ kubectl inspect gpushare

For more details, please run kubectl inspect gpushare -d

2.镜像中申请和使用共享GPU

To request GPU sharing, you just need to specify aliyun.com/gpu-mem

apiVersion: apps/v1beta1
kind: StatefulSet

metadata:
  name: binpack-1
  labels:
    app: binpack-1

spec:
  replicas: 3
  serviceName: "binpack-1"
  podManagementPolicy: "Parallel"
  selector: # define how the deployment finds the pods it manages
    matchLabels:
      app: binpack-1

  template: # define the pods specifications
    metadata:
      labels:
        app: binpack-1

    spec:
      containers:
      - name: binpack-1
        image: cheyang/gpu-player:v2
        resources:
          limits:
            # GiB
            aliyun.com/gpu-mem: 3

3.限制GPU显存使用

为了在应用程序里边限制GPU显存的使用,可以使用如下环境变量:

  • ALIYUN_COM_GPU_MEM_DEV:当前物理设备GPU显存总大小(单位:GiB)
  • ALIYUN_COM_GPU_MEM_CONTAINER:当前容器分配的GPU显存大小(单位:GiB)

示例:通过TensorFlow API设置比例来限制GPU显存

fraction = round( 3 * 0.7 / 15 , 1 )
config = tf.ConfigProto()
config.gpu_options.per_process_gpu_memory_fraction = fraction
sess = tf.Session(config=config)
# Runs the op.
while True:
    sess.run(c)

⚠️

0.7 is because tensorflow control gpu memory is not accurate, it is recommended to multiply by 0.7 to ensure that the upper limit is not exceeded.

©著作权归作者所有,转载或内容合作请联系作者
  • 序言:七十年代末,一起剥皮案震惊了整个滨河市,随后出现的几起案子,更是在滨河造成了极大的恐慌,老刑警刘岩,带你破解...
    沈念sama阅读 158,117评论 4 360
  • 序言:滨河连续发生了三起死亡事件,死亡现场离奇诡异,居然都是意外死亡,警方通过查阅死者的电脑和手机,发现死者居然都...
    沈念sama阅读 66,963评论 1 290
  • 文/潘晓璐 我一进店门,熙熙楼的掌柜王于贵愁眉苦脸地迎上来,“玉大人,你说我怎么就摊上这事。” “怎么了?”我有些...
    开封第一讲书人阅读 107,897评论 0 240
  • 文/不坏的土叔 我叫张陵,是天一观的道长。 经常有香客问我,道长,这世上最难降的妖魔是什么? 我笑而不...
    开封第一讲书人阅读 43,805评论 0 203
  • 正文 为了忘掉前任,我火速办了婚礼,结果婚礼上,老公的妹妹穿的比我还像新娘。我一直安慰自己,他们只是感情好,可当我...
    茶点故事阅读 52,208评论 3 286
  • 文/花漫 我一把揭开白布。 她就那样静静地躺着,像睡着了一般。 火红的嫁衣衬着肌肤如雪。 梳的纹丝不乱的头发上,一...
    开封第一讲书人阅读 40,535评论 1 216
  • 那天,我揣着相机与录音,去河边找鬼。 笑死,一个胖子当着我的面吹牛,可吹牛的内容都是我干的。 我是一名探鬼主播,决...
    沈念sama阅读 31,797评论 2 311
  • 文/苍兰香墨 我猛地睁开眼,长吁一口气:“原来是场噩梦啊……” “哼!你这毒妇竟也来了?” 一声冷哼从身侧响起,我...
    开封第一讲书人阅读 30,493评论 0 197
  • 序言:老挝万荣一对情侣失踪,失踪者是张志新(化名)和其女友刘颖,没想到半个月后,有当地人在树林里发现了一具尸体,经...
    沈念sama阅读 34,215评论 1 241
  • 正文 独居荒郊野岭守林人离奇死亡,尸身上长有42处带血的脓包…… 初始之章·张勋 以下内容为张勋视角 年9月15日...
    茶点故事阅读 30,477评论 2 244
  • 正文 我和宋清朗相恋三年,在试婚纱的时候发现自己被绿了。 大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
    茶点故事阅读 31,988评论 1 258
  • 序言:一个原本活蹦乱跳的男人离奇死亡,死状恐怖,灵堂内的尸体忽然破棺而出,到底是诈尸还是另有隐情,我是刑警宁泽,带...
    沈念sama阅读 28,325评论 2 252
  • 正文 年R本政府宣布,位于F岛的核电站,受9级特大地震影响,放射性物质发生泄漏。R本人自食恶果不足惜,却给世界环境...
    茶点故事阅读 32,971评论 3 235
  • 文/蒙蒙 一、第九天 我趴在偏房一处隐蔽的房顶上张望。 院中可真热闹,春花似锦、人声如沸。这庄子的主人今日做“春日...
    开封第一讲书人阅读 26,055评论 0 8
  • 文/苍兰香墨 我抬头看了看天上的太阳。三九已至,却和暖如春,着一层夹袄步出监牢的瞬间,已是汗流浃背。 一阵脚步声响...
    开封第一讲书人阅读 26,807评论 0 194
  • 我被黑心中介骗来泰国打工, 没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留,地道东北人。 一个月前我还...
    沈念sama阅读 35,544评论 2 271
  • 正文 我出身青楼,却偏偏与公主长得像,于是被迫代替她去往敌国和亲。 传闻我的和亲对象是个残疾皇子,可洞房花烛夜当晚...
    茶点故事阅读 35,455评论 2 266

推荐阅读更多精彩内容