JVM中内存和GC的介绍

内存分布

jvm将内存分为了堆,方法区,程序计数器,栈(虚拟机栈),本地方法栈5个区域,有些是线程共有的有的是线程共享的。下面就简单就这几个区域做简单说明。

程序计数器(PC寄存器)

作用:存储当前线程正在执行的java方法的JVM指令地址,如果执行的是Native方法,则为undefined。

每个线程都有自己的PC寄存器。

Java栈(虚拟机栈)

作用:存放方法调用时产生的帧,数据结构是先进后出的栈。

每一次的调用都会产出一个新的帧,方法的执行伴随着入栈和出栈的操作;该帧存储java方法的局部变量,操作数栈,常量池指针等。同时内部包含了一个局部变量表。线程私有

本地栈

类似Java栈,只不过是在调用native方法时才会使用到

作用:存放Java对象实例,几乎所有创建的Java对象实例都会被直接分配在堆上,被所有线程共享,可以在启动JVM时通过Xmx,Xms等来指定该区域的大小,也是GC工作的主要区域。

方法区

作用:存放一些元数据,如类结构信息,常量,静态变量,常量池也存放于此。在jdk1.7及之前的版本中,将方法区称为永久代,而1.8之后去除了永久代,增加了元数据区。方法区也是线程共享的

总结:线程共享的有方法区和堆,线程私有的是程序计数器,Java栈和本地方法栈。

GC

垃圾收集的目的是为了回收那些占用了内存但是又不会再被使用的对象。

基本收集算法

引用计数

为对象添加一个引用计数,用于记录对象被引用的情况。如果计数是0,说明没有对象引用该对象了,可以被清理;有个问题就是无法解决循环引用的问题。

可达性分析

将对象的引用关系看做是一个图,将选择活动中的对象作为根对象GC Root,然后按图索骥的去查询。如果一个对象和GC Root之间不可达,也就是不存在引用链,那么久认为这个对象时不可达的,可以被清理。JVM会把Java栈和本地方法栈中正在引用的对象,静态属性引用的对象和常量作为GC Root。

清理算法

标记-复制

将内存区域分成两块大小相同的区域(to和from),然后每次都是使用from区域,通过收集算法,将from中还活着的对象迁移到to区域,并且是顺序安放,保证内存的连续性,同时将to区域标记为from区域,原来的from区域标记为to区域。

标记-清除

首先进行标记工作,将要清除的对象进行标记,然后直接进行清除,标记和清除的效率比较高,但是会产生内存碎片化,如果申请大内存,容易引发Full GC,会产生较长时间的STW。

标记-整理

类似于标记-清除,但是为了避免内存的碎片化,会在清理过程中将对象往一个方向移动,保证内存的连续性。

GC执行过程

GC主要发生的区域是在堆区,所以我们先简单分析一下堆的结构。借用别人的一张图:

安装上图,从GC年代的角度划分,java 堆分为:

新生代

新生代是大部分对象的创建和销毁的区域,因此对新生代也做了划分:

Eden区域

Eden会继续划分,为每个线程划分一个TLAB区域,为了安全,会加锁进行竞争;这些TLAB都是连续分配的,如果一个TLAB满了,会继续给当前线程分配新的TLAB。新创建的对象基本都是在当前线程所分配的TLAB中,如果需要创建的对象过大,就会直接分配到老年代。

Survior区域

Survior会平均大小的分为两个区域to和from,然后再GC期间将from和Eden中存活的对象全部迁移到to中,主要是为了避免内存的碎片化。

老年代

放置长生命周期的对象(经历了多次GC存活的对象),通常是从Survior中拷贝过来的对象。但是,如果新创建的对象在Eden中无法找到足够长度的内存,也会直接放到老年代。

堆,新生代,老年代的大小都是可以通过jvm参数进行设置的。

具体执行过程:

Java不断的创建对象,直接分配到Eden区域,如果达到GC设定的阈值,触发Minor GC。存活下来的会被迁移到Survior中的from区域,同时会对这些对象的生命周期加1,表明存活时间。

经过第一次的GC后,Eden会空闲下来,此时继续在Eden上面分配空间,直到再次达到阈值,触发GC,此时会在Eden和Survior中的from同时清理,然后将余下的对象复制到to区域里面,存活时间加1.

多次发生上述第二步后,当存活对象的存活时间达到阈值时,会发生晋升过程,将达到阈值的对象迁移到老年代。这个阈值也是可以设置的。同样,如果Survior大小不够了也会发生晋升。

老年代同意会进行GC 称为Major GC,GC的清理算法根据不同的GC类型而不同,但是大部分是使用的标记-整理,这样可以避免内存的碎片化。

为了形象借用的示意图:

GC的类别

随着技术的发展,jvm出现了很多不同的垃圾收集器。

Serial Old GC:串行的,会触发Stop-The-World,采用标记-整理,用于老年代。

Serial GC:串行的,复制算法,,会触发Stop-The-World,适用于单CPU的client环境

ParNew GC: 并行的,会触发Stop-The-World,用于新生代,复制算法,适用于多核CPU的Server环境。可以简单的理解为Serial的并行版本。

Parallel Scavenge GC:并行的,用于新生代,复制算法,可以控制吞吐量(用户代码运行时间/(用户代码运行时间+垃圾收集时间)),适用于后台运算多,交互少的场景。

CMS(Concurrent Mark Swap) GC: 并发的,标记阶段会触发STW,采用标记-整理算法,用于老年代,适用于服务器

G1 GC:jdk9 后默认的GC,替代CMS,对于大内存的堆空间,性能会比较优越。

总结一下:

新生代主要会使用的垃圾收集器是Serial,Parallel等

老年代主要是CMS,配合其他类型一起。

在此我向大家推荐一个架构学习交流群。交流学习群号:938837867 暗号:555 里面会分享一些资深架构师录制的视频录像:有Spring,MyBatis,Netty源码分析,高并发、高性能、分布式、微服务架构的原理,JVM性能优化、分布式架构等这些成为架构师必备

推荐阅读更多精彩内容

  • 作者:一字马胡 转载标志 【2017-11-12】 更新日志 日期更新内容备注 2017-11-12新建文章初版 ...
    beneke阅读 1,650评论 0 7
  • JVM架构 当一个程序启动之前,它的class会被类装载器装入方法区(Permanent区),执行引擎读取方法区的...
    cocohaifang阅读 1,203评论 0 7
  • 1 CPU和内存的交互 了解jvm内存模型前,了解下cpu和计算机内存的交互情况。【因为Java虚拟机内存模型定义...
    Garwer阅读 285,806评论 51 497
  • 内存溢出和内存泄漏的区别 内存溢出:out of memory,是指程序在申请内存时,没有足够的内存空间供其使用,...
    Aimerwhy阅读 473评论 0 1