在linux中查看运行指定进程资源占用(cpu+gpu)

在linux中查看运行指定进程资源占用(cpu+gpu)

在运行程序时有时候会需要查看资源占用,以方便部署在其他服务器上时进行参考。以下是总结了我在linux上查找程序进程资源的两种方法(cpu和gpu都有)。

CPU

1. 查找进程号

如果进程较多,输入 ps -ef | grep + 指令关键词 进行搜索。如果运行的是python程序,可以输入 ps -ef | grep python3

比如我想查找所有指令中含hello关键词的进程,输入:ps -ef | grep hello

输出示例:

user 52584 75914 0 13:22 pts/9 00:00:00 docker run -it -p 8887:8887 image_hello:v1

user 12345 12345 0 13:21 pts/4 00:00:00 python3 hello.py

其中第二列为pid

2. 查看指定进程号

用top指令查看指定进程(例如我这里查看PID为3833)的进程:

top -p 3833

出现以下内容:

Tasks: 1 total, 0 running, 1 sleeping, 0 stopped, 0 zombie

%Cpu(s): 30.8 us, 11.3 sy, 0.0 ni, 55.6 id, 2.2 wa, 0.0 hi, 0.1 si, 0.0 st

KiB Mem : 26359936+total, 10537104 free, 64877176 used, 18818508+buff/cache

KiB Swap: 0 total, 0 free, 0 used. 19780235+avail Mem

PID USER PR NI VIRT RES SHR S %CPU %MEM TIME+ COMMAND

12345 root 20 0 11.1g 1.9g 126324 S 1308 0.8 196:31.05 python3

其中 RES代表运行内存,%CPU代表运行占用多少核。每100为1.0核(1.0c),以上示例为13.08c。

其他参数解释

倒数第二行为参数名称,最后一行是参数内容。以上参数解释如下:

PID:Process ID,进程标识号。这是系统用来唯一标识活动进程的数字。

USER:该进程所属的用户名称或ID。

PR:Priority,进程的优先级。它显示了进程的调度优先级,数字越小代表优先级越高。

NI:Nice value,进程的nice值。这是一个用户设定的优先级值,用来影响进程的调度优先级。正值降低优先级,负值增加优先级。

VIRT:Virtual Memory Size,虚拟内存大小,单位通常是KiB。它包括进程使用的所有可用内存,包括交换空间、设备映射和分配但未使用的内存。

RES:Resident Set Size,常驻内存大小。这是该进程已分配的、位于RAM中的非交换区内存的大小,不包括被交换出去的部分。

SHR:Shared Memory,共享内存大小。指的是可被其他进程共享的内存量。

S:Process Status,进程状态。常见状态有:

S (sleeping): 睡眠状态

R (running): 运行状态

T (stopped): 停止状态

Z (zombie): 僵尸状态

%CPU:该进程占用的CPU百分比。

%MEM:该进程占用的物理内存百分比。

TIME+:该进程自启动以来占用的CPU总时间。

COMMAND:启动进程的命令名称或命令行。

GPU

如果是NVIDIA GPU,可以使用 nvidia-smi 命令。它会显示所有NVIDIA GPU的使用情况,包括每个GPU的利用率,以及每个进程的具体GPU使用情况。

nvidia-smi 指令示例输出如下:

+-----------------------------------------------------------------------------+

| NVIDIA-SMI 460.32.03 Driver Version: 460.32.03 CUDA Version: 11.2 |

|-------------------------------+----------------------+----------------------+

| GPU Name Persistence-M| Bus-Id Disp.A | Volatile Uncorr. ECC |

| Fan Temp Perf Pwr:Usage/Cap| Memory-Usage | GPU-Util Compute M. |

| | | MIG M. |

|===============================+======================+======================|

| 0 GeForce RTX 3080 Off | 00000000:01:00.0 On | N/A |

| 30% 55C P2 70W / 320W | 5478MiB / 10018MiB | 28% Default |

+-------------------------------+----------------------+----------------------+

+-----------------------------------------------------------------------------+

| Processes: |

| GPU GI CI PID Type Process name GPU Memory |

| ID ID Usage |

|=============================================================================|

| 0 N/A N/A 1569 G /usr/lib/xorg/Xorg 169MiB |

| 0 N/A N/A 2410 G /usr/bin/gnome-shell 106MiB |

| 0 N/A N/A 4021 C python3 5201MiB |

+-----------------------------------------------------------------------------+

Processes部分显示了当前在GPU上运行的进程列表,通常包括进程ID、使用的GPU、使用的内存等信息。通过GPU Memory Usage参数查看每个进程的GPU的显存。

实时监控

nvidia-smi -l 1

这里 1 可以替换为其他数字,代表每x秒刷新一次。

Reference

TOP命令参数详解---10分钟学会top用法 - 新盟教育的文章 - 知乎