Java GC 基础二——内存管理及回收算法

0. 前言


上一篇文章已经介绍过Hotspot 虚拟机的架构以及JVM中内存区域的划分:
Java GC 基础一 ——Hotspot 架构及内存区域介绍,在了解了JVM中内存区域的功能之后,就可以介绍GC的原理和过程了。本文主要想阐述的问题如下:

    1. 怎么发现垃圾?
    1. 发现之后如何回收?
    1. 什么是分代回收?

1. 怎么发现垃圾?


1.1 GC的范围


Java GC 基础一 ——Hotspot 架构及内存区域介绍一文中介绍过,JVM运行时内存区域(Runtime Data Area)有五个部分组成,分别是:堆区,方法区,虚拟机栈、本地方法栈、程序计数器。同时也介绍过,程序计数器、JVM栈和本地方法区的生命周期是随线程起而起、随线程销毁而销毁的,所以它们占用的内存会被自动释放,所以只有方法区和堆区的内存需要进行垃圾回收。

1.2 如何判断对象已死


垃圾回收的本质工作就是找出应用程序不可到达的内存块,将其释放。这里面得不可到达主要是指应用程序已经没有内存块的引用了。
在JAVA中,某个对象对应用程序是可到达的分两种情况:

  • 这个对象被根(根主要是指类的静态变量,或者活跃在所有线程栈的对象的引用)引用;
  • 对象被另一个可到达的对象引用。

两种常用的判断对象是不是需要回收的方法:引用计数法根搜索算法

1.3 引用计数法:


引用计数器的实现很简单,对于一个对象 A,只要有任何一个对象引用了 A,则 A 的引用计数器就加 1,当引用失效时,引用计数器就减 1。只要对象 A 的引用计数器的值为 0,则对象 A 就不可能再被使用。
优点:
引用计数器的实现也非常简单,只需要为每个对象配置一个整形的计数器即可。
不需要暂停整个应用
缺点:
但是引用计数器有一个严重的问题,即无法处理循环引用的情况。因此,在 Java 的垃圾回收器中没有使用这种算法。
举个列子:

objA.instance=objB;
objB.instance=objA;

有对象 A 和对象 B,对象 A 中含有对象 B 的引用,对象 B 中含有对象 A 的引用。此时,对象 A 和对象 B 的引用计数器都不为 0。但是在系统中却不存在任何第 3 个对象引用了 A 或 B。也就是说,A 和 B 是应该被回收的垃圾对象,但由于垃圾对象间相互引用,从而使垃圾回收器无法识别,引起内存泄漏。

1.4 根搜索算法:

通过一系列的名为“GC Root”的对象作为起点,从这些节点向下搜索,搜索所走过的路径称为引用链(Reference Chain),当一个对象到GC Root没有任何引用链相连时,则该对象不可达,该对象是不可使用的,垃圾收集器将回收其所占的内存。
我们来举个例子:Java 虚拟机栈中的一个reference对象右边是java堆中的对象实例。
比如新建了一个对象,那就会有一个reference变量指向heap中的一个对象实例,如果这个object又指向另一个object 那么这个链上的对象都是可达的,而这些没用应用指向的对象就是不可达的。

GC Root Tracing

在java语言中,可作为GCRoot的对象包括以下几种对象:

    1. java虚拟机栈(栈帧中的本地变量表)中的引用的对象。
    1. 方法区中的类静态属性引用的对象。
    1. 方法区中的常量引用的对象。
    1. 本地方法栈中JNI本地方法的引用对象。

判断无用的类:

    1. 该类的所有实例都已经被回收,即java堆中不存在该类的实例对象。
    1. 加载该类的类加载器已经被回收。
    1. 该类所对应的java.lang.Class对象没有任何地方被引用,无法在任何地方通过反射机制访问该类的方法。

2.如何回收垃圾

前一小节讲如何发现垃圾。这一节就主要介绍回收垃圾。JVM中的垃圾收集策略常用的主要有标记-清除算法、复制算法、标记-整理算法

2.1 标记清除算法

标记清除收集器停止所有的工作,从根扫描每个活跃的对象,然后标记扫描过的对象,标记完成以后,清除那些没有被标记的对象。其步骤如下:


Mark-Sweep

优点:

  • 解决循环引用的问题
  • 不需要编译器的配合,从而就不执行额外的指令

缺点:

  • 每个活跃的对象都要进行扫描,收集暂停的时间比较长。
  • 标记-清除算法不需要进行对象的移动,并且仅对不存活的对象进行处理,在存活对象比较多的情况下极为高效,但由于标记-清除算法直接回收不存活的对象,因此会造成内存碎片。

2.2 复制算法

复制收集器将内存分为两块一样大小空间,某一个时刻,只有一个空间处于活跃的状态,当活跃的空间满的时候,GC就会将活跃的对象复制到未使用的空间中去,原来不活跃的空间就变为了活跃的空间。


Copy Collector

优点:

  • 只扫描可以到达的对象,不需要扫描所有的对象,从而减少了应用暂停的时间
  • 没有碎片化的问题 只要移动堆顶的指针按照顺序分配内存即可

缺点:

  • 需要额外的空间消耗,某一个时刻,总是有一块内存处于未使用状态
  • 复制对象需要一定的开销。

2.3 标记清理算法

标记整理收集器汲取了标记清除和复制收集器的优点,它分两个阶段执行,在第一个阶段,首先扫描所有活跃的对象,并标记所有活跃的对象,第二个阶段首先清除未标记的对象,然后将活跃的的对象复制到堆得底部。


Mark-Compact Collector

优点:

  • 该算法极大的减少了内存碎片,并且不需要像复制算法一样需要两倍的空间。
  • 采用标记-清除算法一样的方式进行对象的标记,但在回收不存活的对象占用的空间后,会将所有的存活对象往左端空闲空间移动,并更新对应的指针。
    缺点:
  • 标记-整理算法是在标记-清除算法的基础上,又进行了对象的移动,因此成本更高。

3. 分代回收

Java内存分配和回收的机制概括的说,就是:分代分配,分代回收。对象将根据存活的时间被分为:年轻代(Young Generation)、年老代(Old Generation)、永久代(Permanent Generation,也就是方法区),不同的分代采用不同的GC策略,新生代使用复制算法进行垃圾回收;老年代使用标记-整理算法。

3.1 内存分代

既然提到分代回收,那肯定需要了解JVM中是怎么怼内存进行分代的:对象将根据存活的时间被分为:年轻代、年老代、永久代,它们的特点如图所示下:

  • 年轻代:JVM specification中的 Heap的一部份年轻代分三个区。一个Eden区,两个Survivor区。大部分对象在Eden区中生成。当Eden区满时,还存活的对象将被复制到Survivor区(两个中的一个),当这个Survivor区满时,此区的存活对象将被复制到另外一个Survivor区,当这个Survivor去也满了的时候,从第一个Survivor区复制过来的并且此时还存活的对象,将被复制旧生代。

  • 年老代:JVMspecification中的 Heap的一部份年老代存放从年轻代存活的对象。一般来说年老代存放的都是生命期较长的对象。

  • 永久代: JVM specification中的 Method area 用于存放静态文件,如今Java类、方法等。持久代对垃圾回收没有显著影响,但是有些应用可能动态生成或者调用一些class,例如Hibernate等,在这种时候需要设置一个比较大的持久代空间来存放这些运行过程中新增的类。


    图片.png

3.2 步骤详解

  • Step1:JVM在Eden区根据用户的每次请求创建相应的JAVA对象。

  • Step2:当Eden区的空间不足以用来创建新JAVA对象的时候,JVM的垃圾回收器执行对Eden区的垃圾回收工作,销毁那些不再被其他对象引用的JAVA对象。

  • Step3:将那些被其他对象所引用的JAVA对象移动到S0区,那些不再被其他对象引用的JAVA对象被销毁。Eden区被清理。

  • Step4:随着对象不断创建,Minor GC再次发生,如果S0区有足够空间存放则直接放到S0区;如果S0区没有足够空间存放,则JVM的垃圾回收器执行对S0区的垃圾回收工作,销毁那些不再被其他对象引用的JAVA对象,并将那些被其他对象所引用的JAVA对象移动到S1区。在S0区经历过一次Minor GC的对象的年龄会增长一次。

  • Step5:当Survivor1也满的时候,将其中仍然活着的对象直接复制到Survivor0,以后Eden区执行Minor GC后,就将剩余的对象添加Survivor0。在S1区和Eden区存活的Minor GC的对象的年龄会增长一次。

  • Step6:当一次又一次Minor GC发生,对象的年纪也越来越大,当达到指定的年龄后,他们会被放到年老代中。

  • Step7:随着Minor GC不断发生,越来越多的对象达到指定年龄被添加到年老代中。

  • Step8:最终老年代的剩余内存越来越少,也会进行一次GC,我们称为Major GC。

  • 从上面的过程可以看出,Eden区是连续的空间,且Survivor总有一个为空。经过一次GC和复制,一个Survivor中保存着当前还活着的对象,而Eden区和另一个Survivor区的内容都不再需要了,可以直接清空,到下一次GC时,两个Survivor的角色再互换。因此,这种方式分配内存和清理内存的效率都极高,这种垃圾回收的方式就是著名的“停止-复制(Stop-and-copy)”清理法。
  • 对象如果在年轻代存活了足够长的时间而没有被清理掉(即在几次 Young GC后存活了下来),则会被复制到年老代,年老代的空间一般比年轻代大,能存放更多的对象,在年老代上发生的GC次数也比年轻代少。当年老代内存不足时, 将执行Major GC,也叫 Full GC。
  • 在发生Minor GC时,虚拟机会检查每次晋升进入老年代的大小是否大于老年代的剩余空间大小,如果大于,则直接触发一次Full GC。

参考资料:

《JAVA编程思想》;
Java 内存区域和GC机制 - Leo Chin - 博客园
JVM 内存分代、垃圾回收漫谈

最后编辑于
©著作权归作者所有,转载或内容合作请联系作者
  • 序言:七十年代末,一起剥皮案震惊了整个滨河市,随后出现的几起案子,更是在滨河造成了极大的恐慌,老刑警刘岩,带你破解...
    沈念sama阅读 162,050评论 4 370
  • 序言:滨河连续发生了三起死亡事件,死亡现场离奇诡异,居然都是意外死亡,警方通过查阅死者的电脑和手机,发现死者居然都...
    沈念sama阅读 68,538评论 1 306
  • 文/潘晓璐 我一进店门,熙熙楼的掌柜王于贵愁眉苦脸地迎上来,“玉大人,你说我怎么就摊上这事。” “怎么了?”我有些...
    开封第一讲书人阅读 111,673评论 0 254
  • 文/不坏的土叔 我叫张陵,是天一观的道长。 经常有香客问我,道长,这世上最难降的妖魔是什么? 我笑而不...
    开封第一讲书人阅读 44,622评论 0 218
  • 正文 为了忘掉前任,我火速办了婚礼,结果婚礼上,老公的妹妹穿的比我还像新娘。我一直安慰自己,他们只是感情好,可当我...
    茶点故事阅读 53,047评论 3 295
  • 文/花漫 我一把揭开白布。 她就那样静静地躺着,像睡着了一般。 火红的嫁衣衬着肌肤如雪。 梳的纹丝不乱的头发上,一...
    开封第一讲书人阅读 40,974评论 1 224
  • 那天,我揣着相机与录音,去河边找鬼。 笑死,一个胖子当着我的面吹牛,可吹牛的内容都是我干的。 我是一名探鬼主播,决...
    沈念sama阅读 32,129评论 2 317
  • 文/苍兰香墨 我猛地睁开眼,长吁一口气:“原来是场噩梦啊……” “哼!你这毒妇竟也来了?” 一声冷哼从身侧响起,我...
    开封第一讲书人阅读 30,893评论 0 209
  • 序言:老挝万荣一对情侣失踪,失踪者是张志新(化名)和其女友刘颖,没想到半个月后,有当地人在树林里发现了一具尸体,经...
    沈念sama阅读 34,654评论 1 250
  • 正文 独居荒郊野岭守林人离奇死亡,尸身上长有42处带血的脓包…… 初始之章·张勋 以下内容为张勋视角 年9月15日...
    茶点故事阅读 30,828评论 2 254
  • 正文 我和宋清朗相恋三年,在试婚纱的时候发现自己被绿了。 大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
    茶点故事阅读 32,297评论 1 265
  • 序言:一个原本活蹦乱跳的男人离奇死亡,死状恐怖,灵堂内的尸体忽然破棺而出,到底是诈尸还是另有隐情,我是刑警宁泽,带...
    沈念sama阅读 28,619评论 3 262
  • 正文 年R本政府宣布,位于F岛的核电站,受9级特大地震影响,放射性物质发生泄漏。R本人自食恶果不足惜,却给世界环境...
    茶点故事阅读 33,326评论 3 243
  • 文/蒙蒙 一、第九天 我趴在偏房一处隐蔽的房顶上张望。 院中可真热闹,春花似锦、人声如沸。这庄子的主人今日做“春日...
    开封第一讲书人阅读 26,176评论 0 8
  • 文/苍兰香墨 我抬头看了看天上的太阳。三九已至,却和暖如春,着一层夹袄步出监牢的瞬间,已是汗流浃背。 一阵脚步声响...
    开封第一讲书人阅读 26,975评论 0 201
  • 我被黑心中介骗来泰国打工, 没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留,地道东北人。 一个月前我还...
    沈念sama阅读 36,118评论 2 285
  • 正文 我出身青楼,却偏偏与公主长得像,于是被迫代替她去往敌国和亲。 传闻我的和亲对象是个残疾皇子,可洞房花烛夜当晚...
    茶点故事阅读 35,909评论 2 278

推荐阅读更多精彩内容