排查服务器上占用 GPU 资源的进程信息

1、使用命令 nvidia-smi 查询简单的进程信息

2、使用命令 ll /proc/PID 查询详细的进程信息

  • cmdline: 运行时输入的命令
  • cwd: 运行目录
  • environ: 运行时的环境变量
  • exe: 执行程序的绝对路径
  • fd: 进程打开或使用的文件

3、查询 PID 对应的容器 - Docker Container

  • 方式一:使用命令 cat /proc/PID/cgroup 查看
  • 方式二:使用命令 ps -axjf | grep -B N PID 查看

grep -B N 代表查询关键词前面 N 行的内容

补充:
grep -A N 代表查询关键词后面 N 行的内容
grep -C N 代表查询关键词前后 N 行的内容

推荐阅读更多精彩内容