看完这篇万字的 Android 性能优化的总结,去面试再也不用怕(下)

上部分:看完这篇万字的 Android 性能优化的总结,去面试再也不用怕(上)- 简书

稳定性优化

APP 稳定性的维度

app 稳定一般指的是 app 能正常运行, app 不能正常运行的情况分为两大类,分别是 CrashANR

Crash:运行过程中发生的错误,是无法避免的。

ANR:应用再运行时,由于无法再规定的时间段内响应完,系统做出的一个操作。

如何治理 Crash

应用发生 Crash 是由于应用在运行时,应用产生了一个未处理的异常(就是没有被 try catch 捕获的异常)。这会导致 app 无法正常运行。

如果需要解决的话,就需要知道这个未处理的异常是在哪里产生的,一般是通过分析未处理的异常的方法调用堆栈来解决问题。

Android APP 可以分为 2 层,Java 层和 Native 层。所以如何捕获需要分开说。

Java 层获取未处理的异常的调用堆栈

这个需要了解 Java 虚拟机是如何把一个未捕获的异常报上来的。

未捕获的异常,会沿着方法的调用链依次上抛,直到 ThreadGroupuncaughtException 方法

    public void uncaughtException(Thread t, Throwable e) {
        if (parent != null) {
            // 递归调用,可以忽略
            parent.uncaughtException(t, e); 
        } else {
            // 交给了 Thread.getDefaultUncaughtExceptionHandler() 来处理未捕获的异常
            Thread.UncaughtExceptionHandler ueh =
                Thread.getDefaultUncaughtExceptionHandler();
            if (ueh != null) {
                ueh.uncaughtException(t, e);
            } else if (!(e instanceof ThreadDeath)) {
                System.err.print("Exception in thread \""
                                 + t.getName() + "\" ");
                e.printStackTrace(System.err);
            }
        }
    }

查阅代码发现,发现 ThreadGroup 最终会给 ThreaddefaultUncaughtExceptionHandler 处理。

private static volatile UncaughtExceptionHandler defaultUncaughtExceptionHandler;

上面的代码显示:ThreaddefaultUncaughtExceptionHandlerThread 类的一个静态变量。

看到这里,如何捕获 Java 层未处理的异常就很清晰了,给 Thread 设置一个新的 defaultUncaughtExceptionHandler,在这个新的 defaultUncaughtExceptionHandler 里面收集需要的信息就可以了。

需要注意的一点是 旧的 defaultUncaughtExceptionHandler 需要保存下来,然后新的 defaultUncaughtExceptionHandler 收集信息后,需要再转给旧的 defaultUncaughtExceptionHandler 继续处理。

Native 层获取未处理的异常的相关信息

Java 层如何收集未处理的异常的信息说过了,我们来看看 Native 层发生未处理的异常的话,是如何处理的。 Native 层的处理,需要掌握 linux 的一些知识,由于本人不是特别了解 linux ,这里就直接参考别人的文章了。如果有错误,还请指正。

本人通过查阅资料发现,Native 层如果发生未处理的异常(注:如果 Native 层捕获了异常,是可以通过 JNI 抛到 Java 层去处理的) ,系统会发出信号给 Native 层,在 Native 层如果要收集未处理的异常信息,就需要注册对应信号的处理函数。当发生异常的时候,Native 层会收到信息,然后通过处理器来收集信息。

注册信号处理函数如下:

#include <signal.h> 
int sigaction(int signum,const struct sigaction *act,struct sigaction *oldact));
  • signum:代表信号编码,可以是除SIGKILL及SIGSTOP外的任何一个特定有效的信号,如果为这两个信号定义自己的处理函数,将导致信号安装错误。
  • act:指向结构体sigaction的一个实例的指针,该实例指定了对特定信号的处理,如果设置为空,进程会执行默认处理。
  • oldact:和参数act类似,只不过保存的是原来对相应信号的处理,也可设置为NULL。

有了信号处理函数,后面还要做的事情就是收集信息了,由于本人不是很熟悉 Native 的开发,这里就不展开说了了。

如何治理 ANR

ANRApplicatipon No Response 的简称。如果应用卡死或者响应过慢,系统就会杀死应用。为什么要杀死应用?其实也很好理解,如果不杀死应用,大家会以为系统坏了。

那我们如何监控 ANR 呢?以及我们如何分析 ANR 的问题呢?常见的导致 ANR 的原因有哪些呢?

首先,ANR 的原理是 AMSUI 操作开始的时候,会根据 UI 操作的类型开启一个延时任务,如果这个任务被触发了,就表示应用卡死或者响应过慢。这个任务会在 UI 操作结束的时候被移除。

然后,如何分析 ANR 问题呢?

一般 ANR 发生的时候, logcat 里面会打印 ANR 相关的信息,过滤关键字 ANR 就可以看到,这里不做详细分析,可以参考后面的文章。

然后一般会在 /data/anr 目录下面生成 traces.txt 文件,里面一般包含了 ANR 发生的时候,系统和所有应用的线程等信息(需要注意的是,不同的 rom 可能都不一样),通过 logcat 打印的信息和 traces.txt 里面的信息,大部分的 ANR 可以分析出原因,但是呢,也有相当一部分的 ANR 问题无法分析,因为 logcattraces.txt 提供的信息有限,有时候甚至没有特别有用的信息,特别是 Android 的权限收紧, traces.txt 文件在高 Android 版本无法读取,给 ANR 问题的分析增加了不少的困难。不过好在最近发现头条给 ANR 写了一个系列的文章,里面对 ANR 问题的治理方法,个人觉得很好,这里引用一下。

  • 今日头条 ANR 优化实践系列 - 设计原理及影响因素
  • 今日头条 ANR 优化实践系列 - 监控工具与分析思路
  • 今日头条 ANR 优化实践系列分享 - 实例剖析集锦
  • 今日头条 ANR 优化实践系列 - Barrier 导致主线程假死

本人之前写过一个小的[性能监测的工具,其中有监控 UI 线程 Block 的功能,考虑后续加入头条的 ANR 监测机制,等后续完成了,在做一个详细的总结吧。这次的总结就写到这里。

内存的优化

硬件的内存总是有限的,所有每个应用分到的内存也是有限的,所有内存的优化很有必要,否则应用就没有足够的内存使用了,这个时候就会 Crash 。

内存都消耗在哪里了

优化内存的话,需要了解内存在哪里消耗了了,针对内存消耗大的场景做优化,对症下药,才可以有一个好的优化效果。

Android Studio 里面的 Profiler 工具是一个很好用的工具,通过里面的 memory 工具可以实时监控 APP 运行过程中的内存分配。

dump APP 内存堆栈后,还可以看到各个类占用的内存情况。

有关每个已分配对象的详细信息显示在右侧的 Instance View 中

可以查看每个对象的详细信息。

Android Studio 里面的 Profiler 工具的具体使用教程请参考官方教程,这里就不做详细介绍了。

如何合理使用内存

利用上面的方法,找到内存消耗大的场景,就需要做优化了,主要做法就是想办法减少特定场景下的内存的使用。个人总结了一下平时可能会做的优化。

  • 图片相关的优化

图片是我目前做的应用里面占用内存比较大的一块了,也碰到了一些问题,我主要是通过以下的方法来做优化。

  1. 暂时用不上的图片不加载,比如说,有个网络加载异常的图,不要一开始就初始化,等到真的有异常了需要展示的时候再初始化
  2. 加载图片的时候,尽量加载指定大小的图片,因为有时候会碰到控件的大小小于实际图片尺寸的情况,这个时候,会浪费一些内存。有需要的话,可以让后台返回不同尺寸的图片。
  3. 根据不同的图片格式
  4. 不显示的图片,可以考虑先释放。
  • 尽可能少地创建对象

毫无疑问,如果对象少,内存肯定也消耗的少,那平时需要注意哪些呢?

  1. 自定义 view 的时候,不要在 onDraw 方法里面频繁创建对象。因为 onDraw 方法可能会频繁调用,这个时候就会创建大量的对象。从而造成浪费,同时也会导致 gc 触发的频率升高,造成卡顿。
  2. 尽量少创建线程,创建线程其实是比较消耗资源的,创建一个空的线程,大概会占用 1-2 M 内存。同时一般异步任务很快就会执行完,如果频繁创建线程来做异步任务,除了内存使用的多,还可能 GC 造成卡顿。执行异步任务的话,一般建议用线程池来执行,但是需要注意线程池的使用。
  3. 尽量用 StringBuilder 或者 StringBuffer 来拼接字符串。平时发现的问题主要是在打印 logcat 的时候和拼接后台返回的数据的时候会创建大量的 String,所以如果有类似的情况也可以考虑做一些优化。

内存泄漏是什么

内存泄漏指的是本应该释放的内存,由于一些原因,被 GC ROOT 对象持有,从而而无法在 GC 的时候释放,这样可能会导致的一个问题就是,重复操作以后,APP 没有足有的内存使用了,这个时候系统会杀死 APP 。所以内存泄漏是需要排查的。

如何监控和分析内存泄漏问题

上一个小结总结了上面是内存泄漏,是因为某些 GC ROOT 对象持有了期望释放的对象,导致期望释放的内存无法及时释放。所以如何监控和分析内存泄漏问题就成了如何找到 GC ROOT 的问题。

一般手动分析的步骤是:重复操作怀疑有内存泄漏的场景,然后触发几次 GC 。等几秒钟后,把 APP 的内存堆栈 dump 下来(可以使用 as 的工具 dump),然后用 sdk 里面的 cover 工具转换一下,然后用 MAT 工具来分析内存泄漏的对象到 GC ROOT 的引用链。

手动分析总是很麻烦的,一个好消息是,有一个特别好用的自动监控和分析内存泄漏的工具,这个工具就是 leakcanary ,它可以自动监控并给出内存泄漏的对象到 GC ROOT 的引用链。

使用很简单,只需要在 APP 的 build.gradle 下面新增

dependencies {
  // debugImplementation because LeakCanary should only run in debug builds.
  debugImplementation 'com.squareup.leakcanary:leakcanary-android:2.7'
}

leakcanary 比较核心的一个原理就是利用了弱引用的一个特性,这个特性就是:

在创建弱引用的时候,可以指定一个 RefrenceQueue ,当弱引用引用的对象的可达性发生变化的时候,系统会把这个弱引用引用的对象放到之前指定的 RefrenceQueue 中等待处理。

所以 GC 后,引用对象仍然没有出现在 RefrenceQueue 的时候,说明可能发生了内存泄漏,这个时候 leakcanary 就会 dump 应用的 heap ,然后用 shark 库分析 heap ,找出一个到 GC ROOT 的最短引用链并提示。

常见的内存泄漏的场景

个人总结了下工作中碰到内存泄漏的一些场景,现记录下来,大家可以参考下。

  1. 静态变量持有 Context 等。
  2. 单例实例持有 Context 等。
  3. 一些回调没有反注册,比如广播的注册和反注册等,有时候一些第三方库也需要注意。
  4. 一些 Listener 没有手动断开连接。
  5. 匿名内部类持有外部类的实例。比如 Handler , Runnable 等常见的用匿名内部类的实现,常常会不小心持有 Context 等外部类实例。

操作流畅度优化

为什么会卡顿

为什么卡顿之前,我们先需要简单了解一点硬件相关的知识。就是在界面绘制的过程中, CPU 主要的任务是计算出屏幕上所有 View 对应的图形和向量等信息。 GPU 的主要任务就是把 CPU 计算出的图形栅格化并转化为位图,可以简单理解为屏幕像素点对应的值。

如果操作过程中卡顿了,一般就是 CPU 和 GPU 其中的一个或者多个无法短时间完成对应的任务。

一般而言,CPU 除了需要计算 View 对应的图形和向量等信息,还要做逻辑运算和文件读写等任务,所以 CPU 造成卡顿更常见。一般也是通过减少 CPU 的计算任务来优化卡顿。

影响 CPU 的使用率一般有以下几个方面:

  • 读写文件
  • 解析大量图片
  • 频繁请求网络
  • 复杂的布局
  • 频繁创建对象

如何检测卡顿

虽然我们知道了大概哪些原因会导致卡顿,但是我们无法准确定位出问题的代码点在哪里,针对上面的部分问题,本人写了一个开源库来自动检测。

我们知道,Android 里面,界面的刷新需要再主线程或者说 UI 线程执行。而界面的绘制起始点又利用了 Looper 消息循环机制。Looper 消息循环机制有一个有意思的特点,就是 Looper 在 dispatch Message 的时候,会在 dispatch 前dispatch 后利用 Printer 打印特定 tag 的字符串,通过接管 Printer ,我们就可以获取 dispatch message 前后的时机。

然后我们可以在 dispatch message 之前,在异步线程启动一个抓取系统信息的延时任务。在 dispatch message 之后,我们可以移除异步线程的这个延时任务。如果某个消息的执行没有超过阈值,那就表示在异步线程的延时任务被取消,表明没有卡顿。如果某个消息的执行时间超过了阈值,那异步线程里的延时任务就会执行,表明有卡顿,异步线程的延时任务会获取此时的系统状态,从而辅助我们分析卡顿问题。

如何优化卡顿

如何检测说完了,我们来说说如何优化。在 为什么会卡顿 小结我总结了几种常见,现在对几种场景的优化总结下。

读写文件

最常见的一个读写文件而不自知的就是 SharePerfrences 的使用,使用 sp 的时候需要注意不要频繁调用 apply 或者 commit 方法,因为每调用一次就有可能会有一次写文件操作(高版本系统做了优化 apply 做了优化,不一定会写文件)。所以,如果调用次数多的话,就会多次写文件,写文件又是一个耗时且耗资源的操作,所以要少做。

一般优化方法是合理拆分 sp 文件,一个 sp 文件不要包含太多的项,同时每一项的内容尽量短。尽量批量提交数据后再 commit 或者 apply 。同时需要注意的是 commit 会直接触发写文件(内容有变化的时候),所以如果在 UI 线程调用 commit 方法需要注意可能会阻塞 UI 线程。

如果有更高的性能需求,可以考虑用 mmkv 来替换或者 DataStore 来替换 sp 。具体的替换方法就不细说了。网上有很多资料参考。

另外一个常见的读写文件的场景是从 xml 文件里面读取布局、色值等操作,这些都是一些 io 操作。从 xml 读取布局的话,可以考虑用代码直接创建 view 来优化,从 xml 里面读取颜色可以考虑加个 HashMap 来优化。

解析大量图片

解码图片毫无疑问是一个计算量大的操作,所以一般加载图片的时候最好根据实际显示的尺寸做压缩,并且保存压缩后的缩略图,方便下次直接加载。

另外还需要注意列表滚动过程中,控制对图片的加载,一般列表在滑动过程中,不加载图片,等列表滚动停止后,才开始加载图片。

另外的一个优化的方法就是减少图片的使用,不过这个难度有点大。

另外还可以考虑针对不同的图片格式,用不同的解码格式。比如 png 格式的图片根据机器实际情况选择 8888 或者 4444 解码方式解码图片。如果是 jpg/jpeg 格式的图片,就用 565 的解码方式解码图片。对于用不同的解码方式解码图片,效率是否会高,本人没做过测试,但是毫无疑问,内存的使用是不同的。

频繁请求网络

网络请求的话,可以参考下面的优化方法。

  1. 如果使用 okhttp 请求网络的话,尽量全局使用一个 httpclient ,这样做的好处是可以复用,提高网络请求效率。

  2. 后台支持的话,开启 gzip 压缩,这样网络传输的数据量小些,传输效率会高些。

  3. 自定义 dns ,减少解析 dns 的时间。

  4. 通过和后台商量,部分数据后台接口一步到位,尽量避免多次请求后才拿到完整的目标数据。

复杂的布局

如果布局复杂的话, CPU 要进行大量的计算才可以确定最终的图形。所以布局复杂的话,CPU 需要大量的运算资源,所以优化复杂的布局是很有必要的。

  1. 减少布局层次,可以利用 ViewStub 、merge 和 include 等标签来尝试减少布局层次。

  2. 使用高效的布局容器,比如 ConstraintLayout,可以不用嵌套布局容器来实现复杂效果。

  3. 部分效果可以考虑用自定义 View 实现。

这个优化感觉不是特别好做,可能优化了,但是效果不好,但是又不能不做。

频繁创建对象

为什么这个要列出来呢?因为频繁创建对象,可能会短时间内消耗大量内存,然后内存不足的时候系统就会尝试 GC 来回收对象,而 GC 是很耗资源的操作,虽然现在 Android 系统对 GC 做了很多优化,但是尽量减少 GC 的触发总是好的。

一般频繁创建对象的场景有:

  • 自定义 View 的时候,在 onDraw 方法创建临时对象
  • 循环里面使用 "+" 拼接字符串
  • ArrayList 等有容积限制的容器类初始化的容量不合理,导致后续新增数据频繁扩容。

可能还有一些场景没有列出来,如果大家有好的建议,可以提出来。

除了频繁创建对象可能会触发 GC ,如果某次使用过大的内存也可能会导致 GC ,比如展示一个超大的 Bitmap ,虽然可以用缩略图来展示,但是可能会碰到需要放大查看具体细节的场景,这个时候可以考虑采用裁剪显示区域(BitmapRegionDecoder)的方式来解析图片。

小结

以上是我工作中涉及到的优化点,可能不是很全,也难免有遗漏。如果有错误和遗漏,还请大家指正。

PS:关于我


本人是一个拥有6年开发经验的帅气Android攻城狮,记得看完点赞,养成习惯,关注这个喜欢写干货的程序员。

另外耗时两年整理收集的Android一线大厂面试完整考点PDF出炉,【完整版】已更新在我的【Github】,如有面试、进阶需要的朋友们可以去参考参考,如果对你有帮助,可以点个Star哦!

地址:【https://github.com/733gh/xiongfan】

推荐阅读更多精彩内容