os.fork 函数

——参考自《Python编程金典》

  在并行执行的多个任务的应用程序中,创建新进程非常有用。例如,Apache Web服务器使用多个进程处理多个客户请求。每个进程都是主Apache 进程的一个完全相同的拷贝,在这种情况下,有效的做法是生成主Apache进程的完全相同的拷贝。因为每个进程都执行相同的任务。

  新建进程的另一个方法是使用os.fork函数,它只在相融于POSIX的系统上可用。在Windows版本的Python中,os模块没有定义os.fork函数,因为windows不支持用fork新建进程。相反,Windows程序员要用多线程编程技术来完成并发任务。

一、

  下图描述了 os.fork 函数如何新建进程。程序每次执行时,操作系统都会创建一个新进程来运行程序指令。进程还可调用 os.fork ,要求操作系统新建一个进程。“父进程”是调用 os.fork 的进程。父进程所分支(或创建)的任何进程都是“子进程”。每个进程都有一个不重复的“进程ID号”,或称“pid”,它对进程进行标识。进程调用fork函数时,操作系统会新建一个子进程,它本质上与父进程完全相同。子进程从父进程继承了多个值的拷贝,比如全局变量和环境变量,两个进程唯一的区别就是fork的返回值:child(子)进程接受返回值0,而父进程接受子进程的pid作为返回值。调用fork函数后,两个进程并发执行同一个程序,首先执行的是调用了fork之后的下一行代码。父进程和子进程既并发执行,又相互独立;也就是说,它们是“异步”执行的。

image.png

image.png

可能的输出

image.png

image.png

  第5行将变量 processName 初始化成“parent”,将当前进程指定为父进程。第8行打印父进程的pid和processName。然后,第12行调用os.fork 函数,创建当前进程的一个副本。如果操作系统不能新建进程,os.fork 函数会引发OSError异常,第14行将退出程序;否则,操作系统会创建一个新进程。进程的两个副本(父与子)会从子进程创建的位置继续执行,但各自位于单独的内存空间。
  如果程序必须在父进程和子进程中并行执行不同任务,程序可用if语句检测fork 在每个进程中返回的值。然后,进程可根据那些if语句的结果执行恰当的任务。记住fork在新建的子进程中返回0 ;而在父进程中,fork返回子进程的pid,这必须是一个正整数。在上面的例子中,父进程执行的任务与子进程不同。如果执行进程是父进程,fork的返回值是子进程的pid。然后,进程执行父进程特有的代码。如果执行进程是子进程,forkPID就是0,这会禁止子进程执行父进程特有的代码,而执行子进程特有的代码。

  注意:子进程把变量 processName 的副本变成值“child”。程序在一个进程中修改变量值,其他进程中的变量值不会改变。相反,每个进程都单独包含一个名为 processName 的变量值。函数os.getpid返回当前正在执行的线程的pid。注意在示范输出中,子进程的pid与父进程中的forkpid相匹配。父进程可使用子进程的pid来管理子进程。

  注意上面两个输出是有区别的。调用os.fork 而创建子进程之后,父进程和子进程作为异步的并发进程而单独执行。“异步”是指它们各行其是,相互间不进行同步。“并发”是指它们可并行发生,也就是同时执行。所以,我们无法预测子进程和父进程的相对速度。

二、

  有时,父进程必须等子进程结束,才可继续执行。例如,子进程可能执行一个计算,而父进程需要得到计算结果才能继续。os.wait 函数可等候子进程,并在它执行完毕之后才继续执行父进程。该函数返回包含两个元素的一个元祖,包括已完成的子进程的pid,以及子进程的“退出状态”。如返回状态为0,表明子进程成功完成;正整数表明子进程终止时出错。如果没有子进程,os.wait函数会引发OSError异常。

image.png

可能的结果
image.png

  该程序创建两个子进程,父进程在两个子进程都执行完毕之后才会终止。每个子进程都调用time.sleep 函数,以休眠随机秒数。调用sleep函数的目的是使子进程看起来在执行一些任务。

三、

  要指示父进程等候一个指定的子进程终止,可在父进程中使用 os.waitpid 函数。该函数只适用于UNIX兼容系统,它可等候一个指定的进程结束,然后返回一个双元素元祖,其中包含子进程的pid以及那个进程的退出状态。如指定的pid不存在,或者子进程在调用waitpid之前便已终止,waitpid 函数就会引发 OSError 异常。函数调用将pid 作为第一个参数传递,并将一个“选项”作为第二个参数传递。如第一个参数大于0,waitpid 会等候具有指定pid的进程。如第一个参数是-1, waitpid会等候当前进程的任何子进程,也就是具有和os.wait 函数一样的行为。如果是正常操作,传给 os.waitpid 的“选项” 参数应该是0 ,如将该参数设为常量 os. WHOHANG, 那么对于具有指定pid的进程,如果没有可用的状态信息,waitpid 函数调用就应立即返回。

推荐阅读更多精彩内容

  • Linux 进程管理与程序开发 进程是Linux事务管理的基本单元,所有的进程均拥有自己独立的处理环境和系统资源,...
    JamesPeng阅读 1,469评论 1 11
  • 计算机系统漫游 代码从文本到可执行文件的过程(c语言示例):预处理阶段,处理 #inlcude , #defin...
    wildimgine阅读 1,341评论 0 4
  • 引出 我们学习了进程,是为了去用多进程,那么,为什么需要用到多进程呢? 1:为了提高效率,支持大用户量的并发。 2...
    小鼻子球球小昏昏阅读 23评论 0 0
  • 1.内存的页面置换算法 (1)最佳置换算法(OPT)(理想置换算法):从主存中移出永远不再需要的页面;如无这样的...
    杰伦哎呦哎呦阅读 1,137评论 1 7
  • 不管你现在做什么,只要你足够热爱,足够坚持,那一定会在某个时刻爆炸,所有利你的资源滚滚而来。 为什么会发出如此感叹...
    熊孩子CEO阅读 75评论 0 1