Linux进程管理 简介
何为进程,我想这个问题大家再熟悉不过了吧,无非就是“执行中的程序”!
概念性的东西本文暂时忽略或者略微一提,详细信息还需要阅读相应的blog或专业书籍。(博主收藏了计算机相关的大量国内外知名书籍,需要的可以留言,免费奉上)
1. 进程资源
进程的运行需要内存、CPU等资源,系统为进程提供两种资源:
内核空间进程资源:即PCB(Process Control Block, 进程控制块),包括PID、PPID、打开的文件表项、当前目录与当前终端信息等;
特点:只能通过系统调用才可以访问,当前进程退出,由另外的进程进行资源回收
详细定义:可见/usr/src/kernels/xxx/include/linux/sched.h
的struct task_struct
用户空间进程资源:包括进程的代码段、数据段、堆、栈以及可共享的库的内存空间
2. 进程状态信息
进程的状态在Linux系统中主要分为五个:
- Running: TASK_RUNNING
运行态或就绪态(得了了除CPU意外的其它所有资源)- Waitting:
- Waitting Interuptable:TASK_INTERRUPTIBLE
等待状态,等待资源有效时唤醒,可被中断唤醒- Waitting Uninteruptable:TASK_UNINTERRUPTIBLE
等待状态,等待资源有效时唤醒,不可被中断唤醒
- Stop: TASK_STOPPED
进程被暂停,当再次允许时可再次执行- Zombie:TASK_ZOMBIE
进程用户资源空间被释放,但PCB并未释放,等待父进程回收
3. 进程属性
1). PID
进程号(Process IDentification),是进程的唯一标识,为一个正整数,由内核分配,用户无法修改。
获取PID的函数为:
函数:getpid()
作用:
获取该进程的PID头文件:
#include <unistd.h>
函数原型:
pid_t getpid(void)
返回值
成功:pid号
失败:-1
2). PPID
父进程号(Parent Process IDentification),是父进程的唯一标识,为一个正整数。
获取PPID的函数为:
函数:getppid()
作用:
获取父进程的PID头文件:
#include <unistd.h>
函数原型:
pid_t getppid(void)
返回值
成功:pid号
失败:-1
3). PGID
进程号(Parent Process IDentification),是父进程的唯一标识,为一个正整数。
获取PGID的函数为:
函数:getpgid()
作用:
获取本进程所属进程组的组号头文件:
#include <unistd.h>
函数原型:
pid_t getpgid(pid_t pid)
返回值
成功:pgid号
失败:-1
4. 进程管理
1). 创建进程 – fork
Linux的最初进程为init
,PID为1,所有其它进程都是由该进程直接或间接创建。
创建进程常用函数为fork()
和vfork()
:
- 函数:fork
作用:
创建新的进程,被创建的进程为子进程,子进程复制父进程的几乎所有信息(所有用户空间信息和绝大多数内核空间信息),子进程独立于父进程的内存空间。头文件:
#include <unistd.h>
函数原型:
pid_t fork(void)
返回值:
成功:父进程中返回子进程的PID(正整数),子进程中返回0
失败:-1
- 函数:vfork
作用:
同样是创建一个新进程
与fork
的区别在于:创建进城后并不复制父进程的地址空间,而是在必要的时候才申请内存空间;即共享父进程的内存空间头文件:
#include <unistd.h>
函数原型:
pid_t vfork(void)
返回值:
成功:父进程中返回子进程的PID(正整数),子进程中返回0
失败:-1
2). 运行新代码 – execX家族
当fork()
创建子进程后,在子进程中需要运行新的程序,则可以采用两种方式:
system(const char *cmd): 创建一个新的子进程执行
cmd
,执行完成后返回到父进程,为阻塞执行
execX家族: 不创建新进程,执行完成后,该语句执行完成后结束本进程
- system
头文件:
#include <stdlib.h>
函数原型:
int system(const char* command)
返回值:
成功:0
失败:-1
- execX 家族
头文件:
#include <unistd.h>
函数原型:
函数 原型 使用文件名(p) / 路径名 使用参数表(l) / argv(v) execl int execl(const char *path, const char *arg, …) l execlp int execlp(const char *file, const char *arg, …) p l execle int execle(const char *path, const char *arg, …, char * const envp[]) l execv int execv(const char *path, char *const argv[]) v execvp int execvp(const char *file, char *const argv[]) p v execve int execvpe(const char *file, char *const argv[], char *const envp[]) v
- 参数:
- path: 欲执行的程序名(可不包括路径),在$PATH中查找
- file: 欲执行的程序名(绝对路径)
- argv[]: 参数列表
- envp[]: 新执行程序的环境变量
- …: 执行程度的参数列表,最后一个参数必须为
(char *)NULL
- 返回值:
成功:void
失败:-1
3). 用户空间资源回收 – exit/return
用户空间资源回收由两个函数完成:
return: 退出当前函数,但并不退出当前进程(main函数除外)
exit: 退出当前进程,刷新流缓冲区,关闭所有I/O流
- exit:
头文件:
#include <stdio.h> //for exit() atexit() on_exit() #include <unistd.h> //for _exit()
函数原型:
函数 原型 描述 exit void exit(int status) 调用 atexit() / on_exit() 函数后退出,刷新I/O缓冲区 _exit void _exit(int status) 不调用任何注册函数而直接退出,不处理标准I/O缓冲区 atexit int atexit(void (*function)(void)) 注册一个回调函数,当执行exit时,优先执行回调函数 on_exit int on_exit(void (*function)(int , void *), void *arg) 同at_exit,只是增加了回调函数的参数值
- 返回值:
成功:0 (atexit/on_exit)
失败:非0值 (atexit/on_exit)
4). 内核空间资源回收 – wait
进程退出时,只是清除了用户空间资源,而PCB是由其父进程进行回收的,回收子进程PCB的函数为:wait()
和 waitpid()
.
- wait
作用:
父进程阻塞等待子进程的状态变化,回收该子进程的内核进程资源头文件:
#include </usr/include/sys/wait.h>
函数原型
函数 原型 描述 wait pid_t wait(int *status) 父进程阻塞等待 任何一个 子进程完成后,回收其资源后退出 waitpid pid_t waitpid(pid_t pid, int *status, int options) 父进程阻塞等待 指定子进程 完成后,回收其资源后退出
- 参数:
- pid: 子进程ID号
PID 描述 PID>0 等待该PID的进程结束 PID=0 等待与当前进程的进程组PGID一致的进程结束 PID=-1 等待任意子进程结束,相当于 wait() PID<-1 等待进程组PGID等于该PID(绝对值)结束
- status: 子进程退出时的状态信息
- options:等待选项,一般设置为0,特殊情况请查阅man
5). 三种新进程启动方式比较:
启动方式 | 特点 |
---|---|
system() | 需要启动新的shell并在新的shell是执行子进程,所以对环境的依赖较大,而且效率也不高; 同时system函数要等待子进程的返回才能执行下面的语句。 |
execX() | 用新的进程来替换原先的进程,效率较高; 但它不会返回到原先的进程,也就是说在exec函数后面的所有代码都不会被执行,除非exec调用失败。 然而exec启动的新进程继承了原进程的许多特性,在原进程中已打开的文件描述符在新进程中仍将保持打开, 但需要注意,任何在原进程中已打开的目录流都将在新进程中被关闭。 |
fork() | 用当前的进程来复制出一个新的进程,新进程与原进程一模一样,执行的代码也完全相同; 但新进程有自己的数据空间、环境变量和文件描述符, 我们通常根据fork函数的返回值来确定当前的进程是子进程还是父进程, 即它并不像exec那样并不返回,而是返回一个pid_t的值用于判断,我们还可以继续执行fork后面的代码。 用fork与exec系列函数就能创建所需的进程。 |
5. 特殊进程
1). 孤儿进程
因父进程先退出而导致一个子进程被init
收养,称该进程为孤儿进程。
孤儿进程的父进程为init
,该进程在孤儿进程退出后回收其PCB
2). 僵死(僵尸)进程
进程已经退出,但是其父进程尚未来得及回收其PCB资源,即其PCB资源还没有释放,成为 “Zomble”
3). 守候进程
守候进程是在后台运行的一个特殊进程,它脱离于终端,可避免被终端所产生的信号打断;执行过程中的任何信息不在终端显示;周期性的执行某些任务或等待处理某些发生的事件。
其实,Linux上存在大量守候进程,如web,日志管理进程等。