# 主机能看到 GPU 占用进程号,但不知道运行在哪
$ nvidia-smi
+-----------------------------------------------------------------------------+
| Processes: |
| GPU GI CI PID Type Process name GPU Memory |
| ID ID Usage |
|=============================================================================|
| 0 N/A N/A 1794854 C ./bin/llama_example 31534MiB |
| 1 N/A N/A 1916178 C ...onserver/bin/tritonserver 15454MiB |
| 2 N/A N/A 1809897 C /usr/bin/python3 16738MiB |
| 7 N/A N/A 3306896 C /bin/python 39964MiB |
+-----------------------------------------------------------------------------+
# 核心指令
# 比如查看 PID 1809897
# 找到了目标容器的启动命令, 以及容器名称为 lmdeploy
$ ps -e -o pid,cmd,comm,cgroup | grep 1809897
1809897 /usr/bin/python3 /usr/local lmdeploy 12:perf_event:/system.slice/docker-d33d781cbad158192f3819f1118f46ccb1979298a563f6d19f627d8602e6edfb.scope,11:freezer:/system.slice
3758737 grep --color=auto 1809897 grep 8:devices:/system.slice/ssh.service,7:pids:/system.slice/ssh.service,6:blkio:/system.slice/ssh.service,4:cpu,cpuacct:/system.slice/ssh.service,3:memory:/system.slice/ssh.service,1:name=systemd:/system.slice/ssh.service,0::/system.slice/ssh.service
# 再次通过 docker container id 确认
$ docker ps | grep d33d781cbad1
d33d781cbad1 nvcr.io/nvidia/tritonserver:22.12-py3 ... lmdeploy
# 此时可以 exec 进入容器,进行删除
容器内使用 GPU 后,忘记进程启动在哪,查看并清理
©著作权归作者所有,转载或内容合作请联系作者
- 文/潘晓璐 我一进店门,熙熙楼的掌柜王于贵愁眉苦脸地迎上来,“玉大人,你说我怎么就摊上这事。” “怎么了?”我有些...
- 文/花漫 我一把揭开白布。 她就那样静静地躺着,像睡着了一般。 火红的嫁衣衬着肌肤如雪。 梳的纹丝不乱的头发上,一...
- 文/苍兰香墨 我猛地睁开眼,长吁一口气:“原来是场噩梦啊……” “哼!你这毒妇竟也来了?” 一声冷哼从身侧响起,我...
推荐阅读更多精彩内容
- 环境 操作系统:WIN10IDE:Eclipse CDT编译器:Cygwin+Mingw g++GDB: gdb ...
- 错误1.docker容器内运行pytorch多gpu报错 RuntimeError: NCCL Error 2: ...
- 1.问题现象 组件反馈使用systemd控制进程后,相应的JAVA进程已启动,并且通过ps可以查看到进程,但是jp...
- 1、使用docker容器内的 nginx+uwsgi+django 在服务器A(没有域名)上部署一个简单的Web项...