并行、并发、多线程、多进程、协程到底啥关系?

本人公众号:算法的秘密 聚焦面试中各种算法题,欢迎关注
认真把这些概念的关系梳理清楚,绝对是一件打根基的好事。作为自学计算机的人,越早明白这些基本概念,就越能提高自己的自学速度。

1、并行(Parallelism)

并行是说同一时刻做很多操作。多进程是实现并行的有效方法。因为它可以将许多任务分配到计算机的多个核心上。多进程很适合计算密集型的任务,因为它充分地利用了多个CPU。

2、多进程(MultiProcessing)

根据上面叙述,多进程将多个任务分配到不同的cpu上,从而实现同一时刻,处理多个任务。它很适合计算密集的任务。
从上面的介绍也可以看出,如果计算机只有一个cpu,那么多进程也是无法实现并行的。

3、并发(Concurrency)

并发是比并行更加宽泛的概念,它指的是,多个任务可以交叉重叠进行。用一个例子来说明下并发和并行两个概念。假设你开了一个餐馆,只有一个厨师,但同时有两桌客人点了菜。简称A桌和B桌,为了让两桌客人都满意,你可以安排厨师,交叉地为两桌客人做菜。为A桌做一道菜,再为B桌做一道菜,如此交叉进行,直到做完所有的菜。这个只能叫并发,不能叫并行。如果你多雇一个厨师,两个厨师,一个做A桌的菜,一个做B桌的菜,这个就算并行了。

4、多线程(Threading)

多线程是实现并发的一个手段。一个进程可以拥有多个线程。当有多个cpu时,多个线程是可以同时执行的,这时就是并行。如果只有一个cpu,那么多个线程可以交叉重叠执行,这时就是并发了。

多进程和多线程比较起来,多线程一般适用于IO密集型的任务。多进程适用于计算密集型的任务。

可能,你会有疑问,多线程既然可以并行执行,岂不是也适用于计算密集型的任务?理论上是这样的,只是这里说多进程更适合,是说当数据量比较大时,计算任务之间没有逻辑上的依赖时,多进程更合适一些。因为每个进程都会有自己的进程内存空间,各个进程之间天然隔离。而多线程共享同一个内存空间,线程之间的同步是必须考虑的问题。而这些问题都不是计算密集型任务必须的。所以我们说计算密集型任务更适合多进程。

5、 协程(Coroutine)

有了以上四个部分的介绍,是时候引入协程的概念了。简单讲,协程是另一种实现并发的手段,这里的并发,特指不是并行的并发。

通过第4部分的介绍,我们看到线程也是可以实现这种非并行的并发的,从这一点上看,协程和线程更像一点。

但是,协程却是用单进程,单线程的方式来实现的。

之前提到过,多线程适合IO密集型任务,但这里要提出的是,协程是更加适合IO密集型任务的一种机制,因为线程还需要线程切换的开销,协程却没有。

运用协程机制最典型的场景就是异步IO。
所谓异步,是指一段程序在执行完成前有能力“暂停”,让其他程序段执行。
如果你对异步IO有疑惑,请参考这篇文章。https://www.jianshu.com/p/3d603166f54d

6、无总结不进步

协程的出现,可以说是解决IO密集型任务时,比线程更加轻量的解决方案,本文从和协程的相关的概念分析中,阐述清楚了协程在并发编程的位置。希望对大家理解协程有一点帮助。最后,用一张图总结下本文:


image.png

References:
1、 https://realpython.com/async-io-python/
2、https://blog.csdn.net/qq_33290787/article/details/51790605

推荐阅读更多精彩内容