Java内存优化之POI Excel(一)

结算系统上线后,每到月初月末,都有点胆战心惊,最怕听到“某某某,我这个下载又不行”、“我这个都下载了20分钟了,怎么还不行啊!”...... 我能怎么办哇,停下来把锅捡起来呗。

捡锅记之检锅

捡锅了,然后呢?当然是查一查问题出在哪了。ssh上服务器,先说说服务器配置吧。这台服务器是在某离职大神的建议下购买的,配置还不错。单核SSD硬盘,其他配置如下:

[web@monitor ~]$ free -m
              total        used        free      shared  buff/cache   available
Mem:           3790        2467         173           0        1150        1021
Swap:             0           0           0

[web@monitor ~]$ cat /etc/redhat-release 
CentOS Linux release 7.3.1611 (Core) 

查看服务状态

记得当初车险系统刚升级SpringBoot的时候,经常发现系统挂掉,Java进程也被kill掉,还纠结了好久,排查了很久发现是被由于Linux的OOM Killer机制杀掉的。

Linux OOM_killer是Linux自我保护的方式,当内存不足时不至于出现太严重问题,有点壮士断腕的意味。在kernel 2.6,内存不足将唤醒oom_killer,挑出/proc/<pid>/oom_score最大者并将之kill掉,可以把/proc/<pid>/oom_score_adj值改小(最小-17)来临时避免此种情况。

所以出现服务停止后,我第一反应就是查看Java进程还在不在。

[web@monitor ~]$ jcmd
19335 settlement.jar --spring.profiles.active=prod
30142 sun.tools.jcmd.JCmd

居然还在,唯一的借口都不给我!

检查Java进程栈

我第一个想到的是死锁,导致进程假死。看看Java栈:

[web@monitor ~]$ jstack -l 19335
2017-11-03 21:44:07
Full thread dump Java HotSpot(TM) 64-Bit Server VM (25.144-b01 mixed mode):

"http-nio-8087-exec-10" #1017 daemon prio=5 os_prio=0 tid=0x00007f2cd0016000 nid=0x5c31 waiting on condition [0x00007f2c9d21a000]
   java.lang.Thread.State: WAITING (parking)
    at sun.misc.Unsafe.park(Native Method)
    - parking to wait for  <0x00000000920abcf8> (a java.util.concurrent.locks.AbstractQueuedSynchronizer$ConditionObject)
    at java.util.concurrent.locks.LockSupport.park(LockSupport.java:175)
    at java.util.concurrent.locks.AbstractQueuedSynchronizer$ConditionObject.await(AbstractQueuedSynchronizer.java:2039)
    at java.util.concurrent.LinkedBlockingQueue.take(LinkedBlockingQueue.java:442)
    at org.apache.tomcat.util.threads.TaskQueue.take(TaskQueue.java:103)
    at org.apache.tomcat.util.threads.TaskQueue.take(TaskQueue.java:31)
    at java.util.concurrent.ThreadPoolExecutor.getTask(ThreadPoolExecutor.java:1074)
    at java.util.concurrent.ThreadPoolExecutor.runWorker(ThreadPoolExecutor.java:1134)
    at java.util.concurrent.ThreadPoolExecutor$Worker.run(ThreadPoolExecutor.java:624)
    at org.apache.tomcat.util.threads.TaskThread$WrappingRunnable.run(TaskThread.java:61)
    at java.lang.Thread.run(Thread.java:748)

   Locked ownable synchronizers:
    - None
..... 

太长了,此处截取部分。我记得jstack 有时候可以帮我们检测出死锁的,可以直接

jstack -l <pid> | grep deadlock

如果有结果,则表示有死锁,当然也不排除其他情况(ps: 也遇到过数据库链接失效,导致某任务执行了3个多小时后失败的。)jstack的其他情况可以参考下:http://blog.csdn.net/wanglha/article/details/51133819

检查Java堆

Java对象大部分情况实在堆上创建的(有时候会在栈上或者有块叫做TLAB的空间),那么来检查下堆的情况吧。

[web@monitor ~]$ jmap -heap 19335
Attaching to process ID 19335, please wait...
Debugger attached successfully.
Server compiler detected.
JVM version is 25.144-b01

using thread-local object allocation.
Parallel GC with 2 thread(s)

Heap Configuration:
   MinHeapFreeRatio         = 0
   MaxHeapFreeRatio         = 100
   MaxHeapSize              = 1879048192 (1792.0MB)
   NewSize                  = 625999872 (597.0MB)
   MaxNewSize               = 625999872 (597.0MB)
   OldSize                  = 1253048320 (1195.0MB)
   NewRatio                 = 2
   SurvivorRatio            = 5
   MetaspaceSize            = 21807104 (20.796875MB)
   CompressedClassSpaceSize = 1073741824 (1024.0MB)
   MaxMetaspaceSize         = 17592186044415 MB
   G1HeapRegionSize         = 0 (0.0MB)

Heap Usage:
PS Young Generation
Eden Space:
   capacity = 569901056 (543.5MB)
   used     = 105560864 (543.5MB)
   free     = 464340192 (0MB)
   100% used
From Space:
   capacity = 27262976 (26.0MB)
   used     = 6621032 (6.314308166503906MB)
   free     = 20641944 (19.685691833496094MB)
   24.28580064039964% used
To Space:
   capacity = 26214400 (25.0MB)
   used     = 0 (0.0MB)
   free     = 26214400 (25.0MB)
   0.0% used
PS Old Generation
   capacity = 1253048320 (1195.0MB)
   used     = 55013328 (1195.0MB)
   free     = 1198034992 (0MB)
  100% used

纳尼!!!Eden区和老年代都耗尽了(这些数据是后来假造的,当时的确看到的是两个100%)。

看看gc情况

[web@monitor ~]$ jstat -gcutil 19335
  S0     S1     E      O      M     CCS    YGC     YGCT    FGC    FGCT     GCT   
  0.00  99.79  99.89   98.99  97.96  96.07    901    3.654     287    1.160    4.814

介绍下这几个参数,S0、S1表示两个Survivor区(复制GC算法使用),E表示Eden区,大部分对象在此创建,O老年代,多次GC后对象存活区域,M表示元数据区(JAVA8后取代永久代,存放一些class元数据,我们不用太关心它,基本上有JVM帮我们管理),YGC和FGC分别表示Eden区GC次数和Full GC的次数,正常情况下Full GC次数比较少,跑个几天Full GC几次差不多了,如果很多次就不正常了(当然排除哪个二货手动调用System.gc()),Full GC比较多,你可能会看到如下错误:java.lang.OutOfMemoryError: GC overhead limit exceeded,这个表示JVM试图通过GC回收内存,但是什么也没有回收到。默认情况下,JVM花费了98%的时间在GC上,但是GC过之后只有不到2%的堆内存被回收。

甩锅记之内存的锅

我去看下这群货到底要下载什么数据,一看吓一跳,两个月全国所有的保单数据。这是什么概念呢?两个月差不多20多万数据吧,如果不做关联单,那差不多是30多万到40万左右,30万行的Excel什么概念?自己想想吧。

我当然不能说你们别下这么多数据啊,反正我一个打工小弟说了也没人听啊!好吧,升级内存总可以吧,这锅你背。

java -Xms1536m -Xmx1536m -jar service.jar

初始化内存和最大内存设置一样是为了减少GC次数,为啥要减少GC呢?简单说就是GC比较霸道,它工作的时候STOP THE WORLD,所有的工作都得停下,等待GC完成。话说什么时候开始GC呢?你可以使用如下命令观察下:

jstat -gcutil <pid> [intervalTime] [invokeCount]
其中intervalTime表示多久执行一次(单位毫秒),invokeCount表示总共会执行多少次。如:jstat -gcutil 19335 1000

大概当Eden区打到100%时会发生一次Young GC,Full GC类似。

堆内存的各个区

改完内存继续观察(后面还会升内存,毕竟这锅给内存背比较简单🤣),发现其实Eden、Survivor、Old区使用情况有很大差异,有的区很快就满了,有的还不到才20几。不行啊,得改,平均点!(这里说的是使用情况,不是都一样大)。

各个区大小比例

可以通过jmap命令查看

[jarvan4dev@Macbook] ~ $ jmap -heap 34890
Attaching to process ID 34890, please wait...
Debugger attached successfully.
Server compiler detected.
JVM version is 25.74-b02

using thread-local object allocation.
Parallel GC with 4 thread(s)

Heap Configuration:
   MinHeapFreeRatio         = 0
   MaxHeapFreeRatio         = 100
   MaxHeapSize              = 2147483648 (2048.0MB)
   NewSize                  = 44564480 (42.5MB)
   MaxNewSize               = 715653120 (682.5MB)
   OldSize                  = 89653248 (85.5MB)
   NewRatio                 = 2
   SurvivorRatio            = 8
   MetaspaceSize            = 21807104 (20.796875MB)
   CompressedClassSpaceSize = 1073741824 (1024.0MB)
   MaxMetaspaceSize         = 17592186044415 MB
   G1HeapRegionSize         = 0 (0.0MB)

默认情况下(JDK8,不同版本可能不一样),NewRatio=2,表示新生代和老年代比例为1:2,SurvivorRatio=8,表示一个Survivor区和新生代比例为1:8,两个Survivor区(S0和S1),即每个Survivor区占堆内存的1/10,调节这两个参数可以调节各区大小比例,来达到最优的使用情况。

java -Xms1792m -XmX1792m -XX:NewRatio=2 -XX:SurvivorRatio=5 -jar service.jar
最后编辑于
©著作权归作者所有,转载或内容合作请联系作者
  • 序言:七十年代末,一起剥皮案震惊了整个滨河市,随后出现的几起案子,更是在滨河造成了极大的恐慌,老刑警刘岩,带你破解...
    沈念sama阅读 158,560评论 4 361
  • 序言:滨河连续发生了三起死亡事件,死亡现场离奇诡异,居然都是意外死亡,警方通过查阅死者的电脑和手机,发现死者居然都...
    沈念sama阅读 67,104评论 1 291
  • 文/潘晓璐 我一进店门,熙熙楼的掌柜王于贵愁眉苦脸地迎上来,“玉大人,你说我怎么就摊上这事。” “怎么了?”我有些...
    开封第一讲书人阅读 108,297评论 0 243
  • 文/不坏的土叔 我叫张陵,是天一观的道长。 经常有香客问我,道长,这世上最难降的妖魔是什么? 我笑而不...
    开封第一讲书人阅读 43,869评论 0 204
  • 正文 为了忘掉前任,我火速办了婚礼,结果婚礼上,老公的妹妹穿的比我还像新娘。我一直安慰自己,他们只是感情好,可当我...
    茶点故事阅读 52,275评论 3 287
  • 文/花漫 我一把揭开白布。 她就那样静静地躺着,像睡着了一般。 火红的嫁衣衬着肌肤如雪。 梳的纹丝不乱的头发上,一...
    开封第一讲书人阅读 40,563评论 1 216
  • 那天,我揣着相机与录音,去河边找鬼。 笑死,一个胖子当着我的面吹牛,可吹牛的内容都是我干的。 我是一名探鬼主播,决...
    沈念sama阅读 31,833评论 2 312
  • 文/苍兰香墨 我猛地睁开眼,长吁一口气:“原来是场噩梦啊……” “哼!你这毒妇竟也来了?” 一声冷哼从身侧响起,我...
    开封第一讲书人阅读 30,543评论 0 197
  • 序言:老挝万荣一对情侣失踪,失踪者是张志新(化名)和其女友刘颖,没想到半个月后,有当地人在树林里发现了一具尸体,经...
    沈念sama阅读 34,245评论 1 241
  • 正文 独居荒郊野岭守林人离奇死亡,尸身上长有42处带血的脓包…… 初始之章·张勋 以下内容为张勋视角 年9月15日...
    茶点故事阅读 30,512评论 2 244
  • 正文 我和宋清朗相恋三年,在试婚纱的时候发现自己被绿了。 大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
    茶点故事阅读 32,011评论 1 258
  • 序言:一个原本活蹦乱跳的男人离奇死亡,死状恐怖,灵堂内的尸体忽然破棺而出,到底是诈尸还是另有隐情,我是刑警宁泽,带...
    沈念sama阅读 28,359评论 2 253
  • 正文 年R本政府宣布,位于F岛的核电站,受9级特大地震影响,放射性物质发生泄漏。R本人自食恶果不足惜,却给世界环境...
    茶点故事阅读 33,006评论 3 235
  • 文/蒙蒙 一、第九天 我趴在偏房一处隐蔽的房顶上张望。 院中可真热闹,春花似锦、人声如沸。这庄子的主人今日做“春日...
    开封第一讲书人阅读 26,062评论 0 8
  • 文/苍兰香墨 我抬头看了看天上的太阳。三九已至,却和暖如春,着一层夹袄步出监牢的瞬间,已是汗流浃背。 一阵脚步声响...
    开封第一讲书人阅读 26,825评论 0 194
  • 我被黑心中介骗来泰国打工, 没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留,地道东北人。 一个月前我还...
    沈念sama阅读 35,590评论 2 273
  • 正文 我出身青楼,却偏偏与公主长得像,于是被迫代替她去往敌国和亲。 传闻我的和亲对象是个残疾皇子,可洞房花烛夜当晚...
    茶点故事阅读 35,501评论 2 268

推荐阅读更多精彩内容