Linux学习笔记之五(父子进程、孤儿进程、僵尸进程、守护进程)-CSDN博客

阿里云国内75折 回扣 微信号:monov8
阿里云国际,腾讯云国际,低至75折。AWS 93折 免费开户实名账号 代冲值 优惠多多 微信号:monov8 飞机:@monov6

Linux

1、进程

进程可以简单的理解为一个正在执行的程序它是计算机系统中拥有资源和独立运行的最小单位。多个进程同时运行从宏观看是并行从微观上看是串行。举个例子现有一个CPU以及两个同时运行的线程a和bCPU实际上是用极小的时间碎片来交替执行a和b以达到肉眼觉得CPU在同时执行两个进程的效果。
在这里插入图片描述
进程有三个状态分别是就绪态、运行态、阻塞态。顾名思义就绪态就是进程万事俱备只等CPU来执行它了运行态便是CPU正在执行该进程阻塞态是线程还没准备好被CPU执行。当然在这三个状态之上又衍生出许多状态这里不多做介绍。
在这里插入图片描述
另外每一个进程都有自己的编号称之为pid(process identity document)。在进程中可以通过getpid()获得当前进程pid也可以通过getppid()获得当前进程父进程的pid。

1.1、进程的六种状态

  1. 运行状态(Running: R)进程在运行或者进程准备好被系统调度。
  2. 睡眠状态(Sleeping: S)此时进程在安静的等待某个事件发生且此时进程也可以被杀死。
  3. 磁盘休眠状态(Disk sleep: D)不可杀死的睡眠状态。
  4. 停止状态(Stopped: T)该进程被某个信号叫停了同时它也可以被叫起来继续运行。
  5. 僵尸状态(Zombie: Z)子进程死了但父进程在忙无法替它收尸此时子进程进入僵尸状态。
  6. 死亡状态(Dead: X)进程被杀死之后尸体也成功回收即资源被回收。

1.2、创建子进程

man 2 fork

在这里插入图片描述
可以看到通过以下代码便可以创建一个子进程。

pid_t pid fork();

返回值成功则返回子进程的pid失败则返回负值。

用fork创建的子进程会和父进程执行同一个可执行文件但子进程会从fork函数之后才开始执行。如图所示
在这里插入图片描述
这里值得注意的是程序的编译会经历四个步骤即预处理、编译、汇编、链接。只有经过这四个步骤之后程序才会变成一个可执行文件而由于这四个步骤会处理好程序的各种变量、头文件、宏定义等内容所以不会导致子进程从fork开始执行下去会因为缺少一些变量定义之类的而产生报错。

1.3、添加子进程任务

如果仅仅使用fork让子进程执行父进程的代码这将使子进程显得毫无意义而为了给子进程添加新的任务exec函数族便被发明出来。从说明书可以看到exec有六个函数。

man execl

在这里插入图片描述
比较常用的使execl通过用execl函数让子进程去执行其他的可执行文件以达到给子进程添加新任务的目的。其函数原型长这样

int execl(const char *path, const char *arg, ... /* (char *) NULL*/);

它的参数应当如何设置我先直接贴一段manual的原文上来。

The  const  char *arg and subsequent ellipses in the execl(), execlp(),and execle() functions can be thought of  as  arg0,  arg1,  ...,  argn.
Together  they  describe  a list of one or more pointers to null-terminated strings that represent the argument list available  to  the  executed  program.  
The first argument, by convention, should point to the filename associated with the file being executed.  
The  list  of  arguments  must be terminated by a null pointer, and, since these are variadic functions, this pointer must be cast (char *) NULL.

这段话大概的意思是execl可以有无数个参数具体取决了即将调用的可执行文件的需要。但除了char *path之外的第一个参数是可执行文件的名字最后一个参数是NULL。

char *path可执行文件所在的目录包含可执行文件的名字。
char *arg1可执行文件的名字。

char *argnNULL

比如我们想在子进程中执行ls。execl可以这个写

execl(/bin/ls”“ls”,NULL);		//仅列出当前目录可见文件
execl(/bin/ls”“ls”, "-l", NULL);		//列出当前目录可见文件详细信息
execl(/bin/ls”“ls”, "-i", "-l", NULL);		//显示文件的inode信息
...

在这里插入图片描述

为什么父进程的getpid()和子进程getppid()得到的值不一样可以参考下面这篇文章父进程中getpid()值与子进程中getppid()值不相同的问题及解释

1.4、孤儿进程、僵尸进程、守护进程

  • 孤儿进程(Orphan process)父进程已经结束子进程还在继续执行。但由于子进程需要父进程来帮助其释放资源所以孤儿进程会被托管在 i n i t init init进程之下。
  • 僵尸进程(Zombie process)子进程已经结束但父进程还在运行且此时父进程无法去帮助子进程释放资源即父进程没有读到子进程的exit()函数。导致子进程死了无人收尸故被称之为僵尸进程。
  • 守护进程(Daemon process)一些脱离于终端且不与用户交互的后台进程叫做守护进程。它们的存在至关重要在背后维护着系统或某个软件、程序正常运行。下图红框内就基本是Windows系统的守护进程。
    在这里插入图片描述

1.4.1、避免僵尸进程

以上这三种进程中孤儿进程是可以成为进入守护进程的前提而守护进程又在许多情况下挥发巨大的作业那么只剩下僵尸进程是程序不愿意看到的。
避免僵尸进程可以用wait系列函数函数我们来看看它的函数说明

man 2 wait

在这里插入图片描述
使用wait()函数得先理清一些概念

  1. 父进程一般不执行其他任务它的存在就是为了生出一堆子进程再派子进程去执行具体任务然后如果子进程死亡了父进程再去替它们收尸。
  2. 子进程死亡之后会向父进程发送一个SIGCHILD信号请求父进程为自己收尸回收资源以避免自己成为僵尸进程。
  3. wait()函数的出现就完美的满足父进程只生娃、收尸、不干事的需求当父进程调用这个函数之后就进入阻塞状态只有在子进程死后发送SIGCHILD信号父进程才会醒过来去收拾子进程的资源。

wait的函数原型是

pid_t wait(int *status);

当调用wait()函数父进程会自动检查子进程的状态无需我们再干预。

int *status是一个32位的整形数据其中包含了退出码、终止信号等信息。通常通过一些宏函数来读取status中的具体信息。当然如果你压根不想要读取这些信息只想默默收尸走人那这个参数可以是NULL。
返回值如果成功则返回子进程的pid反之返回-1。

读取status的宏

  • WEXITSTATUS在进程正常退出的情况下读取status中的退出码并将其返回。如果退出码是负数则用255去加这个负数。退出码即exit(code)中的code
  • WIFEXITED通过解析status判断进程是否为正常退出若是则返回1否则返回0。

此外还有waitpidwaitid等函数前者常用于等待回收某个具体的子进程后者我也不太懂了。。。
贴一段代码来看看wait怎么用

#include <stdio.h>
#include <stdlib.h>
#include <sys/types.h>
#include <sys/wait.h>
#include <unistd.h>

int main()
{       
	pid_t pid = fork();     //create a child process

	if(pid)
	{       
		int status;
		wait(&status);		//waiting for the child to terminate and recliam its resources
		if(WIFEXITED(status))
		{       
			printf("The exit code is: %d\n", WEXITSTATUS(status));
		}
	}
	else
	{       
		printf("This is the child process.\n");
		sleep(2);
		exit(3);
	}
	return 0;
}

1.4.2、创建守护进程

前文提到守护进程是托管在 i n i t init init下的子进程且脱离控制终端独立运行于后台。由此引出创建一个守护进程的两个必要步骤

  1. 使用fork()创建一个新的进程然后在父进程中使用exit()退出。该步骤可以让子进程变成孤儿进程进而被init进程托管。
  2. 在子进程中使用setsid()函数。该函数可以让子进程脱离原来的进程组和会话进入一个全新的会话中去。这有这样该进程才能脱离原来的控制终端。

这两个步骤使创建一个守护进程的必要步骤再次也先暂停下来解释何为进程组和会话。
所谓进程组顾名思义就是许多个进程组成的一个小组该小组的id(Group Identity Document: GID)就是小组组长的pid。接着会话中又会聚集了许多个小组同理会话id(Session Identity Dccument: SID)便是作为翘楚的进程组id(GID)。一般而言一个会话使用一个控制终端不过也有特殊比如对于为守护进程所创建的新会话我们不希望它有一个控制终端。
注控制终端就是我们敲命令行的那个窗口也称终端或终端窗口。在Ubuntu中直接叫terminal终端一个terminal对应一个shell进程。而shell是一个解释器为终端和系统之间的交互提供桥梁。参考link
在这里插入图片描述
接下来添加几个步骤让讲守护进程的更具备撸棒性(robust)。

  1. 通过chdir()把当前的工作目录改成根目录。
  2. 重设文件掩码(umask)一般设为0。
  3. 关闭文件描述符由于文件描述符是内核空间返回给应用层的一个文件“代号”然而在守护进程中我们并不希望再与应用层产生联系所以关闭文件描述符可以节省资源。
  4. 在子进程中再套一个进程防止会话建立新的控制终端。

最后就可以在守护进程中添加我们需要执行的代码了。

1.4.3、杀死守护进程

守护进程一般生命周期比较长由于其脱离了控制终端所以想要关闭守护进程只能等到系统完全关闭或者手动杀死它。比如用kill

kill -9 [the pid of the daemon process]

1.5、综合练习

本次练习任务

  1. 创建一个父进程和一个子进程并分别打印这两个进程的pid。
  2. 在父进程离开后打印此时托管子进程的进程的pid。
  3. 创建一个守护进程要求更改其目录关闭文件描述符号修改文件掩码。
  4. 最后从控制终端杀死这个守护进程。
#include <stdio.h>
#include <stdlib.h>
#include <unistd.h>
#include <sys/types.h>
#include <sys/stat.h>

int main()
{
        pid_t pid = fork();
        if(pid) 								//enter the parent process
        {
                printf("the pid of the parent processs is: %d.\n",getpid());
                exit(1);
        }
        else    								//enter the child process
        {
                sleep(1); 						//waiting for the parent process to terminate
                printf("the pid of the child processs is: %d, and parent is: %d. \n",getpid(),getppid());
                setsid();     		//create and enter a new session
                chdir("/");     				//change the working directory
                umask(0);       				//change the umask
                for(int i=0;i<3;i++){close(i);} //close the file descriptor
                while(1)
                {
                	//you can put any programs you like into this field.
                }
        }
        return 0;
}

输出结果是

the pid of parent process is: 2600.
the pid of child process is: 2601, and its parent is: 1420.

可以看到子进程的父进程已经和原来创建它的父进程pid不一样了我们通过搜索看看是谁托管了这个子进程。

ps -aux | grep 1420

在这里插入图片描述
可以看到是init进程托管了这个子进程。此外当该孤儿进程使用setsid()函数变成守护进程之后如果再使用printf()之类的函数将失去效果。因为守护进程没有其对应的控制终端自然无法让printf()发挥作用。

阿里云国内75折 回扣 微信号:monov8
阿里云国际,腾讯云国际,低至75折。AWS 93折 免费开户实名账号 代冲值 优惠多多 微信号:monov8 飞机:@monov6
标签: linux