[022]Android 9.0中Binder Driver改进点

前言

昨天正好有一个网友和我讨论一个问题,他给我看下面这个图,我说这个应该是Android 8.0以及之前版本的流程图。
Android 8.0以及之前的版本

Android 9.0之后已经不是这样子了,Android 9.0之后版本的流程图应该是这样子的。


Android 9.0以及之后的版本
对比两幅图,大家可以明显的看到,第2步协议BR_TRANSACTION_COMPLETE,被推迟到了第5步。

Android 8.0和9.0代码对比

我们对比8.0和9.0的代码看看,首先先看看BR_TRANSACTION_COMPLETE是怎么来的。两者的代码基本一致,我们需要找到BINDER_WORK_TRANSACTION_COMPLETE是哪里发出来的?

//android 8.0
static int binder_thread_read(struct binder_proc *proc,
                  struct binder_thread *thread,
                  binder_uintptr_t binder_buffer, size_t size,
                  binder_size_t *consumed, int non_block)
{
....省略部分代码
        case BINDER_WORK_TRANSACTION_COMPLETE: {
            cmd = BR_TRANSACTION_COMPLETE;//这个就是8.0的BR_TRANSACTION_COMPLETE(第2步)
            if (put_user(cmd, (uint32_t __user *)ptr))
                return -EFAULT;
            ptr += sizeof(uint32_t);
            binder_stat_br(proc, thread, cmd);
            list_del(&w->entry);
            kfree(w);
            binder_stats_deleted(BINDER_STAT_TRANSACTION_COMPLETE);
        } break;
//android 9.0
static int binder_thread_read(struct binder_proc *proc,
                  struct binder_thread *thread,
                  binder_uintptr_t binder_buffer, size_t size,
                  binder_size_t *consumed, int non_block)
{
....省略部分代码
        case BINDER_WORK_TRANSACTION_COMPLETE: {
            binder_inner_proc_unlock(proc);//这是唯一的差别
            cmd = BR_TRANSACTION_COMPLETE;//这个就是9.0的BR_TRANSACTION_COMPLETE(第5步)
            if (put_user(cmd, (uint32_t __user *)ptr))
                return -EFAULT;
            ptr += sizeof(uint32_t);
            binder_stat_br(proc, thread, cmd);
            kfree(w);
            binder_stats_deleted(BINDER_STAT_TRANSACTION_COMPLETE);
        } break;

从下面代码可以发现,BINDER_WORK_TRANSACTION_COMPLETE发送的方式有点差异
8.0的代码:

因为在一次binder_ioctl_write_read中执行完binder_thread_write,就会执行binder_thread_read,所以BINDER_WORK_TRANSACTION_COMPLETE就会马上被读到,也就是会第二步就会立刻执行BR_TRANSACTION_COMPLETE。

    //android 8.0 此代码运行在client端的binder_thread_write中
    //发送给server端的BINDER_WORK_TRANSACTION,server会读到这个发起第3步到第5步
    t->work.type = BINDER_WORK_TRANSACTION;
    list_add_tail(&t->work.entry, target_list);
    //发送给client端的BINDER_WORK_TRANSACTION_COMPLETE
    tcomplete->type = BINDER_WORK_TRANSACTION_COMPLETE;
    list_add_tail(&tcomplete->entry, &thread->todo);
    //发现server端的进程休眠
    if (target_wait)
        wake_up_interruptible(target_wait);//唤醒server端的线程
    return;
9.0的代码:
    //android 9.0 此代码运行在client端的binder_thread_write中
    tcomplete->type = BINDER_WORK_TRANSACTION_COMPLETE;
    if (reply) {
        ...
        //这是server端返回给client之后给自己发的BINDER_WORK_TRANSACTION_COMPLETE,也就是9.0图中第4步
        binder_enqueue_thread_work(thread, tcomplete);
    } else if (!(t->flags & TF_ONE_WAY)) {
        ...
        /*
         * Defer the TRANSACTION_COMPLETE, so we don't return to
         * userspace immediately; this allows the target process to
         * immediately start processing this transaction, reducing
         * latency. We will then return the TRANSACTION_COMPLETE when
         * the target replies (or there is an error).
         */
        //这个代码就是和8.0中list_add_tail(&tcomplete->entry, &thread->todo)类似
        //这是client端发送给server之后给自己发的BINDER_WORK_TRANSACTION_COMPLETE,也就是9.0图中第5步
        binder_enqueue_deferred_thread_work_ilocked(thread, tcomplete);
    }

我们先来翻译一下中间那段长长的注释:

        /*
         * 推迟TRANSACTION_COMPLETE,我们就不需要立刻返回到用户空间。
         * 这样子就允许目标进程可以立刻的处理这次失误,减少延迟。
         * 我们将会目标进程的回复之后再去返回TRANSACTION_COMPLETE
         */

而且我们可以发现9.0中第4步和第5步,虽然都是发送BINDER_WORK_TRANSACTION_COMPLETE,但是两者调用的方法不同,binder_enqueue_deferred_thread_work_ilocked比binder_enqueue_thread_work_ilocked少调用thread->process_todo = true;其实代码注释写很明白了,两个方法的区别,我就不翻译了。

/**
 * Adds the work to the todo list of the thread. Doesn't set the process_todo
 * flag, which means that (if it wasn't already set) the thread will go to
 * sleep without handling this work when it calls read.
 */
static void
binder_enqueue_deferred_thread_work_ilocked(struct binder_thread *thread,
                        struct binder_work *work)
{
    binder_enqueue_work_ilocked(work, &thread->todo);
}

/**
 * Adds the work to the todo list of the thread, and enables processing
 * of the todo queue.
 */
static void
binder_enqueue_thread_work_ilocked(struct binder_thread *thread,
                   struct binder_work *work)
{
    binder_enqueue_work_ilocked(work, &thread->todo);
    thread->process_todo = true;
}

简单小结

1.binder_enqueue_thread_work_ilocked中,因为执行thread->process_todo = true,就会让这次binder_ioctl_write_read中执行完binder_thread_write,立刻执行完binder_thread_read,也就是立刻执行BINDER_WORK_TRANSACTION_COMPLETE

2.binder_enqueue_deferred_thread_work_ilocked中,因为没有执行thread->process_todo = false,就会让这次binder_ioctl_write_read中执行完binder_thread_write,在binder_thread_read中休眠,延迟执行BINDER_WORK_TRANSACTION_COMPLETE。

没有执行thread->process_todo = true,为什么会导致如何binder_thread_read休眠?

从下面的代码也可以看的比较清楚了,thread->process_todo == false导致了binder_has_work_ilocked为false,从而导致了binder_wait_for_work中设置当前线程为可中断的状态,进入休眠。

static int binder_thread_read(struct binder_proc *proc,
                  struct binder_thread *thread,
                  binder_uintptr_t binder_buffer, size_t size,
                  binder_size_t *consumed, int non_block)
{
...
    if (non_block) {
        ...
    } else {
        //休眠在这里, wait_for_proc_work为false
        ret = binder_wait_for_work(thread, wait_for_proc_work);
    }
...
}
static int binder_wait_for_work(struct binder_thread *thread,
                bool do_proc_work)
{
    ...
    for (;;) {
        //设置线程状态为可中断状态
        prepare_to_wait(&thread->wait, &wait, TASK_INTERRUPTIBLE);
        //binder_has_work_ilocked是false,所以就会休眠了
        if (binder_has_work_ilocked(thread, do_proc_work))
            break;
        ...
        schedule();//让出cpu,让当前线程休眠
        ...
    }
    ...
    return ret;
}

static bool binder_has_work_ilocked(struct binder_thread *thread,
                    bool do_proc_work)
{
    //thread->process_todo是false,
    //do_proc_work是false
    //thread->looper_need_return是false,所以整体返回false。
    return thread->process_todo ||
        thread->looper_need_return ||
        (do_proc_work &&
         !binder_worklist_empty_ilocked(&thread->proc->todo));
}

以上就是9.0中如何把8.0的第2步推迟到9.0的第5步执行的方法。

思考:为什么Binder驱动要这样子改进?

我个人猜想有两个原因:

1.减少binder_ioctl_write_read的次数,从8.0的两次变成一次

因为每次binder_ioctl_write_read就是一次从用户空间和内核空间的上下文切换,这个切换是需要消耗cpu资源


Android 9.0

Android 8.0

2.让发起Binder通信的Client端进程中Binder服务端的binder_thread_read的优先处理

这句话是不是有点绕,其实一个进程,可能同时既是Binder调用的client,又是Binder调用的server端。
假设这个进程的两个线程:
线程1:作为client端要执行binder_thread_read
线程2:作为server端要执行binder_thread_read
因为在binder_thread_read中是有锁的,binder_inner_proc_lock(proc),这个锁是每个进程一个锁proc。
如果按照8.0的设计,让线程1执行完释放锁,再去执行线程2,
如果按照9.0的设计,让线程1立刻休眠,释放锁,让线程2优先处理。

小结

1.Binder驱动9.0之后的改动比较大,很多锁都变化了,死亡通知的嵌套也改了,对于初学者来说,目前网上资料数据都是按照老的版本代码讲的,千万别搞错了,否则容易产生误会。

2.对于初学者,最好的还是看老的版本Binder驱动,把核心了解清楚了以后,再看android 9.0之后的源码,因为这个版本之后Binder驱动的代码注释非常完整,完全可以看注释学习。

最后编辑于
©著作权归作者所有,转载或内容合作请联系作者
  • 序言:七十年代末,一起剥皮案震惊了整个滨河市,随后出现的几起案子,更是在滨河造成了极大的恐慌,老刑警刘岩,带你破解...
    沈念sama阅读 158,736评论 4 362
  • 序言:滨河连续发生了三起死亡事件,死亡现场离奇诡异,居然都是意外死亡,警方通过查阅死者的电脑和手机,发现死者居然都...
    沈念sama阅读 67,167评论 1 291
  • 文/潘晓璐 我一进店门,熙熙楼的掌柜王于贵愁眉苦脸地迎上来,“玉大人,你说我怎么就摊上这事。” “怎么了?”我有些...
    开封第一讲书人阅读 108,442评论 0 243
  • 文/不坏的土叔 我叫张陵,是天一观的道长。 经常有香客问我,道长,这世上最难降的妖魔是什么? 我笑而不...
    开封第一讲书人阅读 43,902评论 0 204
  • 正文 为了忘掉前任,我火速办了婚礼,结果婚礼上,老公的妹妹穿的比我还像新娘。我一直安慰自己,他们只是感情好,可当我...
    茶点故事阅读 52,302评论 3 287
  • 文/花漫 我一把揭开白布。 她就那样静静地躺着,像睡着了一般。 火红的嫁衣衬着肌肤如雪。 梳的纹丝不乱的头发上,一...
    开封第一讲书人阅读 40,573评论 1 216
  • 那天,我揣着相机与录音,去河边找鬼。 笑死,一个胖子当着我的面吹牛,可吹牛的内容都是我干的。 我是一名探鬼主播,决...
    沈念sama阅读 31,847评论 2 312
  • 文/苍兰香墨 我猛地睁开眼,长吁一口气:“原来是场噩梦啊……” “哼!你这毒妇竟也来了?” 一声冷哼从身侧响起,我...
    开封第一讲书人阅读 30,562评论 0 197
  • 序言:老挝万荣一对情侣失踪,失踪者是张志新(化名)和其女友刘颖,没想到半个月后,有当地人在树林里发现了一具尸体,经...
    沈念sama阅读 34,260评论 1 241
  • 正文 独居荒郊野岭守林人离奇死亡,尸身上长有42处带血的脓包…… 初始之章·张勋 以下内容为张勋视角 年9月15日...
    茶点故事阅读 30,531评论 2 245
  • 正文 我和宋清朗相恋三年,在试婚纱的时候发现自己被绿了。 大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
    茶点故事阅读 32,021评论 1 258
  • 序言:一个原本活蹦乱跳的男人离奇死亡,死状恐怖,灵堂内的尸体忽然破棺而出,到底是诈尸还是另有隐情,我是刑警宁泽,带...
    沈念sama阅读 28,367评论 2 253
  • 正文 年R本政府宣布,位于F岛的核电站,受9级特大地震影响,放射性物质发生泄漏。R本人自食恶果不足惜,却给世界环境...
    茶点故事阅读 33,016评论 3 235
  • 文/蒙蒙 一、第九天 我趴在偏房一处隐蔽的房顶上张望。 院中可真热闹,春花似锦、人声如沸。这庄子的主人今日做“春日...
    开封第一讲书人阅读 26,068评论 0 8
  • 文/苍兰香墨 我抬头看了看天上的太阳。三九已至,却和暖如春,着一层夹袄步出监牢的瞬间,已是汗流浃背。 一阵脚步声响...
    开封第一讲书人阅读 26,827评论 0 194
  • 我被黑心中介骗来泰国打工, 没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留,地道东北人。 一个月前我还...
    沈念sama阅读 35,610评论 2 274
  • 正文 我出身青楼,却偏偏与公主长得像,于是被迫代替她去往敌国和亲。 传闻我的和亲对象是个残疾皇子,可洞房花烛夜当晚...
    茶点故事阅读 35,514评论 2 269