在 CPU只有一个,为什么看起来却是无穷无尽的?这篇文章中,我们介绍了CPU通过时间共享的方式,可以同时运行很多进程,同时我们也整理了进程的创建过程和状态转换过程。今天我们来看一个具体的例子,即Unix系统提供的操作进程API的设计和实现。
熟悉Unix的读者最先想到的可能是fork() 和 exec()这两个系统调用,我们也从它们谈起。有趣的是,fork() 和 exec() 可能会是你见过的最“奇葩”的API了。
fork, exec, wait
简单来说,fork() 用于创建一个新进程;wait() 用于阻塞父进程,直到子进程退出(这其实是不准确的,wait() 有可能在子进程没有退出时也会返回,比如在子进程收到信号导致状态变化的时候);而exec() 用于在创建的子进程中执行其他程序。下面通过具体代码来分析。
L10,getpid() 会返回当前进程的process identifier(PID),pid唯一标识了一个进程,可以通过pid来控制一个进程比如让它停止运行。
L11, fork()
2.1) fork() 函数首先会创建一个子进程,这个子进程是父进程的一个拷贝
2.2) 也就是说,调用fork() 之后,系统会看到两个一样的程序在运行,并且两个程序都正在从调用fork() 的过程中返回
2.3) 根据2.2可以看出,子进程被创建出来之后不是从main() 函数开始执行的,而是从调用fork() 返回的那个点开始执行
2.4) 另外,我们说子进程是父进程的一个拷贝,但是它们还是有区别的。比如子进程有它自己的地址空间,自己的寄存器,自己的PC等等。
2.5) 特别值得说的一个区别是,子进程从fork() 得到的返回值是0,而父进程得到的返回值大于0(如果小于0表示创建子进程失败了)。这就让我们可以根据返回值的不同判断两个进程哪个是父进程,哪个是子进程。
L12-15 fork() 返回值小于0,程序退出
L16-24 由于返回值是0,所以当前进程是子进程。在进程中,调用execvp() 运行 wc 命令,计算程序文件本身的字符数。exec() 是一个函数族,execvp() 只是它的一个变体。
如果说fork() 函数很奇怪,那exec() 函数也不是善茬。它首先把将要运行的程序代码和静态数据载入内存,然后进行必要的初始化比如堆、栈,然后用传进来的参数当作argv 运行这个目标程序。也就是说,exec() 把当前正在运行的程序替换成了目标程序,就像当前程序从没运行过一样。
L25-30 父进程里面调用wait(), 等待子进程推出之后自己再退出。如果不调用wait(), 程序的行为是不确定的,有可能是父进程先退出,也可能是子进程先退出。
程序的输出如下图所示:
为什么把fork 和 exec 分开?
从上面的程序看来,如果想创建一个新进程运行程序,直接一个API做完不就行了吗?为什么有fork() 和 exec() 这么”奇怪”的API设计的?事实证明,把fork() 和 exec() 分开是非常必要的设计,特别对于每个Unix版本都带的 shell程序来说,因为把fork() 和 exec() 分开允许shell 在运行目标程序之前对运行环境做修改,从而实现很多有用的功能。
我们知道,shell 程序是一个用户态程序,它会显示一个命令提示符等待用户输入,在用户输入一个可执行命令名称之后,它会fork() 一个子进程,并调用 exec() 执行该程序,然后调用 wait() 等待子进程结束。当子进程结束之后,它又显示一个命令提示符等待用户的下一个输入,如此往复。这里我们发现,把fork() 和 exec() 分开可以让我们实现很多实用功能,比如:
`prompt> wc file > newfile.txt`
在这个例子中,wc 的输出被重定向到 newfile.txt 中而不是打印到标准输出。shell 程序实现这个功能的方式就是在调用fork() 之后 exec() 之前,先关闭标准输出,然后打开文件newfile.txt,这样子进程的输出就会被重定向到目标文件中。
这里还用了Unix系统文件描述符的一个特性。Unix系统在打开文件的时候会返回一个文件描述符,它会从0开始查找可用的文件描述符。由于先关闭了标准输出的文件描述符,当打开一个新文件的时候,标准输出的文件描述符就会被分配给它。
下图给出了一个简单的代码示例,可以看到在L18关闭了标准输出,L19打开一个文件从而子进程的输出会被写入到文件中。
Unix系统的管道也是用类似的方式实现的,区别是它调用了pipe() 函数。pipe() 函数打开两个文件描述符,一个用于输入,一个用于输出,这样就把程序链串起来了。限于长度不再详述了,想要看示例的可以网上搜索simple_pipe查看相关代码。
总结
上文主要分析了fork() 和 exec() 的功能,以及为什么设计的时候把它们分开。虽然这两个函数的行为比较“奇葩”,但是它们很有用。这也是系统设计中很重要的一点,先把事情做对,再把它做好。有兴趣的读者可以读读系统设计方面写的很好一篇文章,Hints for Computer System Design 。
当然除了本文提到的几个重要函数,系统还提供了其他一些函数,比如kill() 函数用于给进程发信号,用于让进程休眠或者退出等。还有一些很实用的系统命令用于查看进程的状态,比如ps查看正在运行的进程,top查看系统进程占用的资源数据。可以通过man命令来进一步学习。
至此,进程API相关的内容已经做了基本的介绍,下篇文章会写操作系统是怎么让CPU合理而且高效地运行这么多进程的。欢迎关注我的头条号,有写的不好或者不对的地方请评论指出。谢谢!