我是一个JAVA线程,我有话要说

小皮

我是微观的产物,可以被操作系统来回切换,当然切换的过程会有损耗,因为你那么的来回"摆弄"我,总要付出点"体力"吧。现在都讲面向对象编程,主要的思想是对现实世界的抽象,把数据和行为都看成是对象的一部分。但我从来没有见过,现实世界中有哪一样工作会在进行期间不停的中断和切换。但是我能,而且我即使被频繁的来回切换,也丝毫不会感到"头晕"从而找不到"北"。在我被切换回来的时候,我能很清楚的定位到我原先正在执行的位置,因为jvm给我安排了程序计数器这个"管家"。从这点也说明,我并不是孤独的,虚拟机栈和程序计数器的生命周期都跟我是一样的,当我不存在的时候他们也随着消失了,因此人们常常说他们是我私有的。哦,对了,局部变量就是放在这个虚拟机栈中的,有时候大家也称为线程栈,就因为这些资源是我私有的,没有人跟我"抢",我便能够很安全的使用它们,专业点说就是线程安全的。但同时JVM又很关照我们,JVM给我和我的同伴们分配了可以共享的空间比如方法区、JAVA堆,伴随着幸福来临的同时也增加了竞争这些共享空间的烦恼,为了应对操作系统交给我们的任务,我和我的同伴之间不得不去争抢打开这个空间的"锁"。不过我们又再一次幸运,JVM继续特殊照顾我们,在JAVA堆中又给我们分配了可供我们"每个人"独享的缓冲区(ThreadLocal Allocation Buffer,TLAB)。其实面对竞争也不用太担心,随着JAVA这么多年的成熟发展,已经有高级的工具类在帮助大家使用我们了,比如ExecutorFramework、并发集合(ConcurrentCollection)、同步器(Synchronizer),大家在日常工作中可以直接利用这些工具来处理绝大多数下遇到的竞争所带来的并发问题。

我可以通过Thread类new一个出来,也可以通过Runnable实现出来。另外我跟各个系统平台还有很大关系,我虽然诞生自JVM的虚拟环境,但运行时的程序本身是用C语言之类的开发语言编写的本机程序,因此我还占用了本机资源,比如本机内存,这点可以观察Thread类里面有很多的native方法就能明白我确实不能像其他类那样"潇洒",因为这意味着我所拥有的这些方法往往是没有使用或者没有办法来使用跟平台无关的手段来实现。另外多啰嗦一句,有时候需要本机内存的操作随jvm的实现不同也会有差别,但有些操作很常见,比如启动我这个线程的时候,加载类的时候,还有网络或者文件I/O操作等等,这些操作都需要本机内存的参与,这得益于JNI的支持使得JAVA运行时能够很方便的调用类似C语言编写的本机代码。所以说到这里的话,因操作系统不同因而实现不同,也就不仅仅是我自己不那么"潇洒"了,当然多数基本的类型还是都自由自在的畅游在JVM这个环境下的。

当我的线程同伴越来越多的时候,我们之间是如何协调合作的呢,操作系统交给我们了两种方法,一种是让我们自己管理自己,当我把自己的工作完成之后,我使用CPU的时间到了,我便会主动通知其它的线程同伴可以开始使用CPU来工作了,就跟接力赛似的"一棒一棒"的传下去,这种方式下,我们之间没有竞争,当然也不会有很多程序员所抱怨的同步问题了,大家都生活在一个和谐的社会,这种方式专业术语叫作"协同式调度";在这种方式下如果有的同伴过于"贪婪"或者工作效率低下,则会一直把持着CPU的资源不放开,就会直接导致上层程序阻塞了,鉴于这种可能情况的发生,操作系统站出来主动承担责任来解决这一问题,重新制定了规则,加入了市场竞争,系统来为我们分配执行时间,我和我的同伴之间的"交班"将不再有我们自己决定了,系统来控制着我们使用CPU资源的时间片,当有一个优先级比我高的线程出现的时候,系统就很可能会允许把我的执行权抢走。这种方式也有一个专业术语叫做"抢占式调度"。但这也不是绝对的,JVM环境里面为我们定义了10个级别,在上文的地方我也告诉大家了我的诞生跟本机操作系统有直接关系,我实际是通过映射到系统的原生线程上来实现的,所以呢这个级别的调度跟操作系统有很大关系,有的操作系统的线程级别多余10个,有的又少于10个,比如windows便只有7个,当我这个JAVA线程运行在少于10个的操作系统上的时候,我的级别中就不得不被挤掉几个,从而有级别相同的情况发生了。所以依靠我自身的线程级别就变的不太靠谱了。

说了这么多,应该如何使用我呢,我是不建议你们直接使用我的,因为比如当你们直接使用newThread的时候,我其实既充当了工作单元,又是执行机制。当做策略的和执行任务的集成在一起,就会大大失去灵活性。那么推荐大家使用一些线程框架,比如在ExecutorFramework在这个框架中工作单元和执行机制便是分开的。其实也不建议大家直接使用这个框架里面的Executors,在访问量不是太大,负载比较小的服务器上面可以直接使用Executors.newCachedThreadPool,但是对于访问量大,负载大的服务应用就不推荐使用了。newCachedThreadPool这种方式没有使用队列,如果线程不够,就创建一个新的线程,极有可能导致CPU全部被占用,那么到底一个服务器可以跑多少个线程呢,大家也可以参考[《架构修炼之道》](https://item.jd.com/12560888.html)第5章中的内容。为了最大限度的控制线程池,就直接使用ThreadPoolExecutor类。大家一定要充分利用好我啊,随着计算机的运算能力越来越强大,就想着让计算机尽可能的去同时做好多个事情,时常有好多个程序员在千方百计的设法"压榨"计算机的运算能力,而我就是这个被"压榨"过程中不能不被考虑的一个因素。

reference:

《深入理解计算机系统》

《深入理解JAVA虚拟机》

《EffectiveJava》

看得懂的书,请仔细看;看不懂的书,请硬着头皮看。--某程序员

本文为原创:抄袭必究,转载请注明出处。

推荐阅读更多精彩内容