正文内容

操作系统入门（四）线程概念、与进程的关系和线程模型

栏目：其他内容系列：操作系统入门发布时间：2022-02-13 15:51 浏览量：1297

本系列文章目录

展开/收起

线程是调度和运行的最小单位（程序执行流的最小单位）。

为什么引入线程？

传统进程机制中，一个进程内的代码只能串行运行，但是一个进程可能也需要同时处理多个任务，例如QQ软件可能要同时运行视频聊天的处理程序，也要运行传送文件程序。

为了满足这种需求，操作系统引入了线程，进程就不再是运行调度的最小单位，而只是资源分配的单位，线程变成了运行调度的最小单位（作为CPU的分配单元），同一个进程内的线程之间可以并发，不同进程之间（的线程）也可以并发，进一步提高了计算机并发程度。

进程具的两个明显属性：资源分配的单位和运行调度的单位。

进程实体具有自己的内存空间，包括程序、数据、PCB和栈，还有其他资源如打开的文件、占用的设备等，这是他的资源分配属性。而它的调度和运行属性被赋予了一个新的实体——线程。系统对进程的调度运行实际上是对线程的调度运行。

引入了线程后发生了什么变化

线程的属性

线程是调度的单位；

每个线程都有一个线程ID和线程控制块（TCB）；

线程也有就绪、阻塞和运行这3种基本状态；

线程几乎不独立拥有系统资源，而是共享进程内的资源，但线程可以独立拥有CPU资源（一个进程内的多个线程可以在不同的CPU上并行运行证明线程可以拥有CPU资源）。

由于共享进程的内存空间，因此同一个进程中的线程间通信几乎无需系统干预；

切换同一进程的线程不会引起进程切换，开销很小；切换不同进程的线程会引起进程切换，开销大。

问题：为什么创建进程的开销 > 创建线程的开销？为什么切换进程的开销 > 切换线程的开销？

开销可以分为时间开销和空间开销。

研究为什么创建进程的开销 > 创建线程的开销，就要先知道创建进程比创建线程时多了资源的分配。

从空间开销上，创建一个进程需要为该进程分配内存、IO设备、文件等资源，内部线程无法被系统单独分配资源，只需要共享进程的这些资源即可，所以一个线程占用的资源不可能超过它所在进程的资源，因此从空间开销上进程占用空间和资源的开销肯定大于线程；

从时间开销上，创建一个进程时需要将该进程的程序从磁盘装入内存，涉及磁盘IO请求到响应的时间（磁头定位磁道和扇区，数据在磁盘和内存间拷贝）；分配资源时，如果该资源是互斥共享的且被其他进程占用，进程还需要等待资源被释放才能从创建态进入就绪态；创建进程时，也会为该进程创建一个主线程，因此创建线程的时间已经被包含在了创建进程的时间里，因此创建进程的开销和创建线程的开销并不是独立的两个开销而是包含关系。实际上创建一个线程的开销无非是创建一个TCB的时间开销，其他该做的进程都已经帮线程做好了。

研究为什么切换进程的开销 > 切换线程的开销，就要先知道进程之间的内存空间是独立的，同一进程内的线程是共享该进程的内存空间的。

进程的切换其本质是不同进程的线程间切换，因此原问题就变成为什么切换不同进程的线程的开销 > 切换同一进程内线程的开销，前者比后者多做了什么事。

线程的切换包含2个步骤：CPU接收和处理中断（时钟中断或IO设备发出的中断）；保存和恢复线程的CPU现场环境（各种寄存器的值），这是前者和后者都会做的事情。

不同进程的线程切换后会导致快表的页表项和高速缓存失效（因为快表中的页表项和高速缓存缓存的是上一个进程的数据），因此进程切换后访问内存会较慢，需要花时间重新构建自己的高速缓存和快表缓存，而同一进程的线程由于共享进程的内存因此切换后页表项和高速缓存并不会失效。

此外进程切换可能导致系统从外存换入新进程页面，换出上一个进程的页面，这也会消耗CPU时间。

此外，进程间通信也比同一进程间的线程通信开销大，无论是使用共享内存还是使用管道通信，都是委托操作系统将数据写入共享内存和管道（或者委托OS取出），需要进行系统调用。而线程间通信无需系统调用，因为他们本身就共享同一进程的内存空间。

线程组成

每个线程都有一个TCB结构（线程控制块）用于保存线程自己的私有信息，thread包含：

1、一个唯一的线程标识符

2、CPU运行现场（如程序计数器、状态寄存器、通用寄存器的值等）。

3、分别指向核心栈和用户栈的两个栈指针，当CPU转为核心态运行时使用核心栈，在用户态运行时则使用自己的用户栈。