×

重拾Java(01) - 第二十年

96
jackfrued
2016.11.29 09:03* 字数 3811

概述

在过去的20年里,如果要选一个最成功的编程语言那一定非Java莫属。根据TIOBE Index发布的编程语言排行榜,自2001年以来Java语言在这个排行榜上最差的名次是第二名。在20年的发展历程中,Java已经不仅仅是一门编程语言,它更是一个平台,是一系列的计算机软件和规范形成的技术体系,从嵌入式系统、移动终端到个人计算机、服务器等领域,Java都占据着举足轻重的位置。按照官方网站在2016年提供的数据,全球有900万Java开发人员并有约60亿台设备都在运行Java程序,这些数字都是非常震撼的。

术语

想了解Java,有三个术语必须要知道:

JDK:Java开发者工具 - Java Developer's Kit
JRE:Java运行时环境 - Java Runtime Environment
JVM:Java虚拟机 - Java Virtual Machine

历史

关于Java这20年的故事,不是一两句话能说清楚的,下面用编年史的方式做一个简要的介绍。

  • 1991年4月,James Gosling(计算机界的全能奇才,被称为“Java之父”)领导的Green Project启动,虽然项目项目并不成功,但是在项目中诞生的Oak语言伴随着互联网潮流的兴起,迅速找到了适合自己发展的市场定位并最终蜕变为Java语言。
  • 1995年5月23日,Java诞生。
  • 1996年1月23日,JDK 1.0正式发布。
  • 1996年5月,第一届JavaOne大会在旧金山举行。
  • 1997年2月19日, SUN公司发布JDK 1.1,代表性的技术包括:JAR文件格式、JDBC、JavaBeans、RMI、内部类和反射等。
  • 1998年12月4日,JDK迎来了里程碑式的版本JDK 1.2,SUN公司将Java技术拆分为3个方向,分别是面向桌面应用开发的J2SE、面向企业级开发的J2EE和面向移动终端开发的J2ME。该版本首次在Java虚拟机中内置了JIT编译器。
  • 2000年5月8日,JDK 1.3发布,代号Kestrel,改进了数学运算、时间以及Java 2D等API,新增了和声音处理相关的类库。此后,SUN公司基本每个两年发布一个JDK的主版本,产品代号都以动物命名。
  • 2002年2月13日,JDK 1.4发布,代号Merlin,Java开始走向成熟并逐渐达到巅峰,今天很多主流框架仍然可以在JDK 1.4上直接运行。该版本中引入了正则表达式、异常链、NIO、日志类、XML解析器等。
  • 2004年9月30日,JDK 1.5发布,代号Tiger,该版本在Java语法的易用性上做出了很大的改进,引入了自动装箱、泛型、注解、枚举、可变参数列表、for-each循环等特性,同时在这个版本中还对Java内存模型进行了改进,同时引入了更优质的用于多线程编程的java.util.concurrent包。
  • 2006年12月11日,JDK 1.6发布,代号Mustang,在这个版本中,J2SE、J2EE和J2ME被更名为Java SE、Java EE和Java ME,提供了对脚本语言的支持以及编译器API和微型HTTP服务器API等内容。此外,该版本还对Java虚拟机内部进行了大量的优化,包括垃圾回收、类加载、锁机制等。同年,SUN公司开始逐渐陷入困境。
  • 2009年2月19日,JDK 1.7发布,代号Dolphin,JDK 1.7最初计划引入很多开发者翘首以盼的功能,包括Lambda表达式,Jigsaw项目、动态语言支持、G1收集器和Coin项目,但是如前所述,由于SUN公司已经陷入困境,无力推动研发工作按正常计划进行,在4月20日Oracle公司宣布以74亿美元收购SUN公司,Java商标从此归Oracle所有,此后Oracle公司执行了所谓的“B计划”,大幅裁剪了JDK 1.7的预定目标,把诸多内容推迟到了JDK 1.8中,随后又宣布Jigsaw在JDK 1.8中依然无法完成。
  • 2014年3月18日,在漫长的等待后,“跳票王”Oracle公司终于推出了JDK 1.8,没有产品代号,这一次真可以说得上是“千呼万唤始出来”。

特点

自Java诞生以来,你可能听过很多关于Java有多么牛逼的描述,但是其中很多内容都是过去时,当下的Java最吸引人的地方应该在于以下几个方面。

  • 对函数式编程的支持:面向对象的编程思想让应用程序的开发变得简单轻松,通过给对象发送消息很多问题就可以得到解决;而函数式编程的思想则源于λ 演算,强调使用表达式而不是语句,通过不改变状态的操作让代码没有副作用,这些都迎合了很多领域的开发者的需求,当下很多高级编程语言都提供了对函数式编程的支持,Java终于在JDK 1.8中引入了Lambda表达式、函数式接口、方法引用等高级语法来支持函数式编程,且看一小段代码。
import java.util.List;
import java.util.Arrays;
class Hello {
    public static void main(String[] args) {
        List<String> list = Arrays.asList("apple", "grape", "pitaya");
        list.forEach(System.out::println);
    }
}
  • 始终如一的平台可移植性:平台可移植性从来都是Java最大的卖点,通过在不同的平台下安装对应的JVM来加载类文件执行,虽然在一定程度上牺牲了执行效率,但获得的是完美的平台可移植性。
  • 支持多种编程语言混编:目前的JVM已经能够支持诸如Groovy、Scala、Clojure这样的语言进行开发。使用非Java语言主要是出于这些考虑:首先使用领域特定语言可以方便构建、持续集成、业务规则建模等操作;其次也可以利用一些动态语言的特性来弥补Java本身的不足,满足快速Web开发、脚本编程和测试等方面的需求。今天有很多软件和系统的开发都是通过多语言混编实现的。
  • 对多核并发编程的支持:Java语言内置的对多线程编程的支持是Java早期的一大卖点,但在今天看来已经不是什么了不起的事情。随着CPU进入多核时代,Java在并发编程上也做出了与时俱进的升级,从JDK 1.5的java.util.concurrent包,到JDK 1.7引入Fork/Join模式,Java程序已经能够轻松的利用多个CPU核心提供的计算能力来协作完成更复杂的任务。

探秘

想要深入学习和了解Java,可以对JVM进行一次探秘。

JVM中的内存

  • 程序计数器(Program Counter Register)
    程序计数器可以视为当前线程所执行的字节码的行号指示器,字节码解释器工作时就是通过改变程序计数器的值来选取下一条需要执行的字节码指令。对于多线程的应用程序,每个线程都需要有一个独立的程序计数器,线程之间互不影响,因此程序计数器是线程私有的内存。
  • 虚拟机栈(VM Stack)
    Java虚拟机栈也是线程私有的,它描述了Java方法执行的内存模型,即每个方法在执行时都会创建一个栈帧用于存储局部变量表(存放了编译期可知的基本数据类型,包括:byte、short、int、long、float、double、char、boolean,对象的引用以及返回地址)、操作数栈、动态链接、方法出口等信息。在JVM规范中,对这个区域规定了两种异常状况:如果线程请求的栈深度大于虚拟机所允许的深度,将引发StackOverflowError;如果虚拟机栈需要扩展空间但无法申请到足够的内存,将引发OutOfMemoryError。
  • 本地方法栈(Native Method Stack)
    本地方法栈顾名思义是调用本地方法(用C/C++编写的方法)时使用的栈。
  • 堆(Heap)
    堆是JVM所管理的内存中最大的一块,它是被所有线程共享的内存区域,在JVM启动时创建,用于存放对象实例。在JVM规范中明确指出:The heap is the runtime data area from which memory for all class instances and arrays is allocated. 但是随着JIT编译器的发展与逃逸分析技术的逐渐成熟,对象实例的栈上分配、标量替换优化将使得“对象一定在堆上”这个说法变得不那么绝对了。堆是Java垃圾收集器管理的主要区域,现在的垃圾收集器都基于分代收集算法,堆通常分为新生代和老生代,新生代具体又可细分为Eden、From Survivor和To Survivor。在启动JVM时可以通过-Xmx和-Xms来控制堆的大小,还可以通过-Xmn和-XX:NewRatio来控制新生代的大小以及新生代和老生代的比例,如果想了解垃圾收集器的工作细节,可以使用-XX:+PrintGCDetails来做到。


  • 方法区(Method Area)
    方法区也是线程共享的内存区域,用于存储已被JVM加载的类的信息、常量、静态变量、JIT编译后的代码等数据。方法区中比较重要的一块是运行时常量池(Constant Pool),它允许运行期间将新的常量放入池中,String类的intern()方法就是一个例子。当常量池无法再申请到内存时也会引发OutOfMemoryError。
  • 直接内存
    JDK1.4中引入了NIO(非阻塞式I/O),它可以使用本地方法分配堆以外的内存,然后通过ByteBuffer/CharBuffer对象来操作这些内存,从而实现提升性能的目标。

说明:Java虚拟机是非常复杂的,如果想要真正理解它的工作原理,可以尝试自己写一个Java虚拟机。不要觉得这件事情遥不可及,有一本名为《自己动手写Java虚拟机》的书就用Go语言实现了一个自己的JVM。

JVM中的对象

  • 对象的创建
    虚拟机遇到一条new指令时,首先将检查这个指令对应的参数是不是能在常量池中定位到的一个类的符号引用,然后还要检查这个对应的类是否已经被加载、解析和初始化过,如果没有就要执行类加载(具体的细节将在后续的文章中探讨)。接下来需要为对象分配内存空间,而且内存空间除对象头外都要被初始化为0值,这就保证了对象的属性在不赋初始值的情况下就能直接使用。再下来,JVM要对对象进行必要的设置,主要是对象头的设置以及对象的初始化工作(按照程序员的意愿为属性设定对应的值),到此一个对象就真正的完成了创建过程。
  • 对象的内存布局
    对于HotSpot虚拟机而言,对象在内存中的布局可以为分3块区域:对象头、实力数据和对齐填充。对象头包含两部分信息,第一部分用于存储对象自身的运行时数据,如哈希码、GC分代年龄、锁状态标识等;另一部分是类型指针,也就是对象指向它的类元数据的指针,虚拟机通过这个指针来确定这个对象是哪个类的实例。
  • 对象的访问定位
    访问一个对象基本上有两种策略:一种是通过句柄访问,引用中存储的是句柄地址,这种方式首先需要在Java堆中划分一块内存作为句柄池,当对象指针发生改变(比如对象被移动),这个时候引用本身的值不需要改变,改变的只是句柄的值;另一种是直接指针访问,引用直接指向内存堆空间中对象的地址。由于对象访问在JVM中非常的频繁,所以第一种方法会造成较大的开销,因此HotSpot虚拟机采用了第二种方式。

开发

如果只想运行Java程序,那么有JRE就足够了,因为它包含了运行Java程序所需的虚拟机还有就是支撑程序运行的上下文环境;如果想要用Java开发应用程序那么就得有JDK,因为JDK中包含了Java开发的必要工具。当然,在开发过程中使用IDE(集成开发环境)可以大大提升开发效率。对于Java开发而言,可以选择的IDE主要有三个:

  • Eclipse:国内有很多程序员都在使用Eclipse,因为它简单、免费、还有很多提升开发效率的特性。
  • IntelliJ:集成的插件和功能较多,代码提示和修复能力强大,可以根据需求对IDE进行定制,有免费和付费两种版本,后者支持的功能更多更强大。
  • NetBeans:我自己使用这个IDE的次数非常少,因此也只能说这是官方提供的开发工具。

书籍

  • 入门读物:Core Java(中文名:《Java核心技术》,目前最新的版本是第10版,非常棒的入门书!)
  • 进阶读物:Thinking in Java(中文名:《Java编程思想》)、Effective Java(提升Java水平必读书籍)、Refactor(中文名《重构:改善既有代码设计》,编程大师Martin Fowler神作)、《Java与模式》(美籍华人阎宏博士力作)
Java开发日记
Web note ad 1