一,进程概念
在我们打开电脑之前,我们的文件都是储存在磁盘上的,而当我们打开电脑,第一个要加载的软件就是操作系统本身,然后再次在此基础上,我们使用的各种软件都要先加载到内存中经过cpu的调度才能正常运行,而正在运行的软件可以简单的理解为进程;
值得注意的是,OS上打开的不只有一个进程,而是多个进程,那么OS是如何管理这些进程的呢?
—-管理一个对象我们还是遵循以往的套路:先组织,再描述;
二,简单理解进程管理2.1描述进程

我们写好的C/c++程序保存在磁盘上,当我们要使用的时候,OS会将此程序的代码和数据加载到内存中,而这个时候其实就可以叫做是一个进程块了;
但是需要注意的是一个进程可并不是只有代码和数据,还要还要包括对应的属性,还需要管理;所以!本质上进程=内核数据结构(task_struct)+程序的代码和数据;
2.2描述进程对象–task_struct
当一个程序的数据和代码加载到内存中时虽然是一个进程块,但是并不完整!OS还要在内核区单独开辟空间还要创建一个描述此进程的对象–task_struct
task_struct是封装了一个进程的属性的结构体,OS通过task_struct来管理进程什么时候给CPU调度,进程的优先级,什么时候进程等待,什么时候阻塞等等各种状态以及对其的各种操作….
OS通过把描述进程的对象task_struct以链表的形式串起来,本质上就是对数据结构的增删查改!
我们来看一下task_struct里面有什么?

2.3对进程组织管理
我们再强调一遍:一个完整的进程=内核数据结构+代码和数据!
对于OS来讲一个进程的代码和数据并不重要,OS关心的是这个进程的PCB数据结构;因为每一个进程的代码和数据都不一样(学校是不管你平时怎么学习,只会根据你的成绩给予你奖励!);而OS有了PCB数据结构就可以找到进程的代码块和数据;
但是往往加载的进程并不是一个两个,而是很多的进程,所以使用一种合适的数据结构在复杂的场景中更好的调度各个数据就显得尤为重要!
在我们的Linux中task_struct主要是以双链表的形式组织起来,你可能会疑惑,使用一个顺序表来存储不是更好吗?
比如HR在筛选简历的时候,会把优秀建立单独按照优秀程度放在一边,这个过程可能会多次对数据删除和插入,使用线性表就显得十分不友好了!而使用链表只需要通过改变指针,就可以灵活的操作!
当然对进程管理工作取决于你把他放入哪个正在被组织的数据结构中,因为不同的数据结构有不同的特点,所以背后对应的就是不同的算法,而不同的算法对应的就是不同的应用场景。
三,查看进程
我们电脑开机,其实就是把OS从外设加载到内存中,因为只有在内存中才能对进程管理!
3.1Windows查看所有进程
在Windows上我们可以直接打开任务管理器进行查看正在运行的进程;


我们也能清楚的看到,各个进程的属性(CPU,内存,磁盘…)这不就是我们刚才说的OS对进程的PCB管理吗?
3.2 ps -ajx
在Linux上使用指令
代码语言:JavaScript代码运行次数:0运行复制
ps -ajx--查看所有进程

我们可以写一个程序来查看进程;

这里我写了个死循环程序来查看正在运行的code进程 ;

我们会发现有两个code进程,为什么呢?
对于死循环的程序是一直会进行下去的,我们可以使用指令来”杀掉他”!

四,进程PID目录-proc

/proc目录里面存储都是内存级的文件!!在关机时会消失,开机时又会出现,他是对动态运行的所有进程的一个可视化信息!!
其中以数字命名的文件夹就是对应进程的PID,里面包含进程的各种信息;

五,获取进程标识符5.1.理解PPID和PID

5.2.调用系统接口–getpid
我们可以使用系统接口来获取当前进程的PID;
先看一下接口说明:

写一个程序来调用接口查看pid;

这里我每隔一秒打印一行PID和PPID;

结论:每次执行程序,分配的PID都不一样,但是父进程PPID是一样的,其实都是Bash进程;
之后,我重新启动了机器!

发现在重启后,PPID竟然改变了!
结论:Bash(命令行)是机器启动时就创建好的进程,直至关机PID都不会变 !
六,重点:使用系统接口fork创建子进程


fork的功能是创建子进程,如果创建成功给子进程的返回值是0,给父进程的返回值是子进程的PID,如果子进程创建失败,就会返回一个负数
你没有听错,fork有两个返回值!
我们可以写个程序查看下!


我们竟然发现,if和else if竟然在同时运行!这也验证了fork的确有两个返回值,虽然if 和else if 同时执行了,但是却是在不同的进程中;
6.1为什么需要创建子进程?
目的:让父子进程执行不同的事情
6.2fork的返回值分析
fork为什么给子进程返回0,其实对于子进程来说只是一个标识作用,他可以使用ps 查看自己的PID和父进程的PID;
fork为什么给父进程返回子进程的PID;因为父进程需要对创建的子进程进行管理,因此就需要拿到子进程的PID(标识子进程的唯一性);
6.3fork函数究竟干了什么?
fork进程创建了一个子进程->进程=内核数据结构+数据和代码块;
什么是写时拷贝?
6.4为什么fork会有两个返回值?
我们现在分析一下fork函数->

我们知道fork函数是拷贝父进程的代码和数据,创建一个新的task_struct,所以这里就有了先后顺序问题;
是先执行完函数返回值之后才创建好了子进程还是在返回值之前就创还能好了子进程呢?
实际上在fork函数内部return id之前,就已经为子进程准备好了一些工作,也就是说在fork结束,return 之前子进程就已经开始执行了,而这时父子进程的fork就会各自执行fork函数的return id语句;
所以!有了两次返回值;
6.5一个变量为什么会有两个值?
本质是发生了写实拷贝!
fork给id变量返回的值并不相同,也就是子进程的fork返回值与父进程的不相同,正好与我们上面提到的写实拷贝一致,修改了父进程的数据,就会单独开辟空间储存新数据;
6.6fork语句之前的语句是否还会执行?
答案是不会,但是会发生拷贝到子进程中!

按照推测”执行此处”只会打印一次

为什么出现了两次”执行此处”呢?
原因是printf默认是行刷新,也就是遇到回车才会刷新缓冲区,而我们打代码中中并没有回车,数据只是写入了缓冲区中没有刷出来,fork执行完,子进程会把缓冲区的内容也拷贝过去,所以各自在进程结束的时候就会把缓冲区刷新,因此出现了两次”执行此处”,并不是子进程执行了printf语句;
下面我们加上n

父进程会自动把”执行此处”从缓冲区中刷新,而子进程是不会执行fork之前的语句的,所以只打印了一次”执行此处”!;
6.7通过fork理解Bash命令行工作