一、进程与线程的概念
进程是多程序设计中操作系统的基本概念,用于描述程序执行的实体。在linux等多用户多进程的操作系统中,通常将这个执行实体称为进程,有时也被称为线程或任务。
在Linux操作系统中,为何进程和线程有时候会互相称呼呢?下面将通过对进程创建和销毁的流程进行阐述,可以更加自然地理解这一点。
1. 创建进程的入口函数
首次遇到进程创建是在Linux启动过程中,rest_init函数调用kernel_thread函数创建了两个内核进程:kernel_init和kthreadd。
1.1 kernel_thread的原型
定义在kernel/fork.c文件内,是调用_do_fork实现的,源码如下:
我们知道kthreadd进程负责创建所有内核线程,那么它是如何创建的呢?循着链表kthread_create_list,可以找到链表是__kthread_create_on_node函数内插入的,进而我们引出了kthread_create、kthread_run等函数。
1.2 kthread_create的原型
定义在include/Linux/kthread.h文件内,是个宏定义。
kthread_create_on_node函数定义在kernel/kthread.c文件内,内部是调用__kthread_create_on_node实现。
当看到EXPORT_SYMBOL标识时,可以知道kthread_create_on_node是对全部内核代码公开的,内核和驱动都可以调用,调用时只需extern该函数声明或包含头文件即可,实际操作中,更多的是使用kthread_create宏。
我们继续看kthread_create_on_node的主要实现函数是__kthread_create_on_node,line 299显示task的数据结构体是struct task_sttruct, 便是进程描述符。
1.3 kthread_run的原型
kthread_run是定义在include/linux/kthread.h头文件的宏,可以看出内部也是调用kthread_create函数实现的。
1.4 对比三个内核创建进程函数
- kernel_thread直接调用_do_fork创建进程,但不对外开放。
- kthread_create创建了进程由kthread进程具体完成创建,间接调用_do_fork实现,但它对所有内核开放。
- kthread_run调用kthread_create创建了进程,并立即唤醒去执行。
2、用户进程该如何创建
在Linux应用编程的时候我们常用三个函数,fork、vfork和pthead__create,区别与内核进程的创建,用户态不能直接调用内核态的进程创建函数,必须经由系统调用system call机制(system call不是本文重点,后面单独一篇详述)。
2.1 fork函数
fork函数调用_do_fork函数创建进程。
2.2 vfork函数
vfork函数调用_do_fork函数创建进程。不同于fork函数,args内多了flags的赋值。
2.3 clone函数
clone函数也是调用_do_fork函数创建进程。不同于fork、vfork函数,args内多了更多参数的赋值。
2.4 小节
创建内核进程的接口有kernel_thread、kthread_create和kthread_run。
创建用户进程的接口有fork、vfork和pthread__create。
这六个接口最终都是调用_do_fork实现的。
3、创建进程的具体实现之_do_fork
用户态和内核态创建进程最终都是直接或间接调用_do_fork实现的。可见_do_fork函数的重要性,内部实现是调用copy_process来创建进程描述符以及子进程执行所需要的所有其他数据结构。
4、进程描述符之Struct task_struct
调用copy_process来创建进程描述符,描述符的数据结构是struct task_struct,定义在include/linux/sched.h文件内。
我们可以简单一撇结构体内的成员变量(有大量删减),单独讲每个成员变量没有意义,后续我们在实际内核功能中理解它们。
5、进程销毁
当一个进程运行结束或者因为异常而终止退出时,该如何操作呢?在用户态常用exit函数来终止,在内核态直接调用do_exit()。
最终都会调用内核函数do_exit(), 该函数可以理解为进程创建的逆过程,即把进程创建的资源一一释放,并调整与其父子进程的关系。具体实现过程不再分析,直接看源码。
6、总结与下一篇计划
本篇主要讲解内核态和用户态创建和销毁进程的接口函数,并侧重介绍了创建过程函数_do_fork。
本篇中讲到用户态调用内核态的函数需要用到系统调用,下一篇着重讲解系统调用的过程。