使用火焰图进行Java应用性能分析

作者: 一字马胡
转载标志 【2017-11-19】

更新日志

日期 更新内容 备注
2017-11-19 新建文章 初版
2017-12-15 Java应用性能分析工具:async-profiler 参考文章实现闭环

导入

本文主要想要记录进行java应用性能分析的一种方式,也就是使用火焰图来进行java应用性能分析,本文将介绍一些工具,包括如何生成profile数据,以及如何根据profile数据生成火焰图等,本文的内容都基于Linux(Ubuntu x64)系统,这一点需要特别注意。如果你有时间的话,可以去阅读以下Java Flame Graphs,作者是Brendan Gregg大神,本文介绍的生成火焰图的工具就出自Brendan Gregg之手。

Action

首先,我们需要收集java代码运行时的profile数据,本文使用的是一个叫做lightweight-java-profiler的工具,你需要下载lightweight-java-profiler,并且自己编译才能使用它来进行数据收集,关于lightweight-java-profiler的更多的细节介绍,可以参考参考链接。你可以直接在github搜索lightweight-java-profiler,并且clone到本地进行编译,当然在编译之前你可以进行一些数据收集的方案定制:


// Things that should probably be user-configurable

// Number of times per second that we profile
static const int kNumInterrupts = 100;

// Maximum number of stack traces
static const int kMaxStackTraces = 3000;

// Maximum number of frames to store from the stack traces sampled.
static const int kMaxFramesToCapture = 128;

// Location where the data are dumped.
static const char kDefaultOutFile[] = "traces.txt";

上面的参数设定在globals.h文件中可以找到,可以根据实际情况进行设定,比如kNumInterrupts的意思就是每秒钟进行数据收集的次数,默认输出profile数据的文件的名字为“traces.txt”,这些你都可以做自定义修改,当改好的之后就可以进行编译了,在64位机器上编译可以使用下面的命令:


make BITS=64 all

如果顺利的话,可以看到会生成一个build-64的文件夹,里面有一个.so文件叫做liblagent.so,这就是我们需要的收集profile数据的.so文件。现在,你可以在启动你的java应用的时候加上下面的参数:


-agentpath:${path}/lightweight-java-profiler/build-64/liblagent.so

然后就可以获取到trace.txt文件。接下来,就需要将java应用的运行时profile数据转换为可视化的火焰图来进行性能分析了,将profile数据转换为火焰图的工具上文已经提到过,可以在FlameGraph下载,下载完成之后,就可以运行下面的命令来生成火焰图了:


cd FlameGraph
./stackcollapse-ljp.awk < ${path}/traces.txt | ./flamegraph.pl > {$path}/traces.svg

现在,你应该可以得到一个火焰图的.svg文件了,在浏览器中打开就可以看到火焰图的细节了。关于火焰图,可以参考下面的说明:


The y-axis is stack depth, and the x-axis spans the sample population. Each rectangle is a stack frame. Color is not important, it's randomized to differentiate frames. The ordering from left to right is also unimportant.

You look for the widest frames, from bottom up, and forks in the "flames", which indicate different code paths taken

所以,我们在看火焰图的时候,主要关注比较宽的就可以发现性能问题了,因为越宽代表占用的CPU时间越多,也就越是性能瓶颈,当然这种分析得结合实际的应用代码,下面是一张火焰图,具体的分析就不在本文的中进行了。本文仅记录一种分析java应用性能问题的方案,采用观察运行时火焰图的方式来发现应用的性能瓶颈是一种比较直观的方法,而采集profile数据使用lightweight-java-profiler,将采集到的profile数据转换为火焰图使用工具FlameGraph,当未来需要对java应用进行性能优化的时候,可以采用这种方案来发现性能瓶颈,并及时进行优化。

火焰图示例

推荐阅读更多精彩内容