Flink 源码之Credit Based反压

Flink源码分析系列文档目录

请点击:Flink 源码分析系列文档目录

什么是credit反压

在数据发送端(CreditBasedSequenceNumberingViewReader)维护了对应的数据接收端(RemoteInputChannel)的credit信息,表示下游还可以接收credit个buffer的数据。每一次向下游发送buffer数据的时候(getNextBuffer),credit减去buffer的数量。当credit值为0的时候,停止向下游发送数据。下游在有新的空闲内存的时候会通知上游有新的credit可用(notifyCreditAvailable)。上游接收到新增的credit数量之后,更新对应channel的credit数量,重新开始向下游发送数据。

下游AddCredit请求的发送过程

RemoteInputChannel有新credit可用的时候需要告知上游去增加自己的credit数值。以上通过调用notifyCreditAvailable方法完成。此通知方法在回收内存(recycle),监听器发现有缓存可用的回调函数(notifyBufferAvailable)和分配积压任务所需内存(onSenderBacklog)时,新增加的buffer数大于0且unannouncedCredit从0变为非0的时候调用(unannouncedCreditRemoteInputChannel暂时还没有向上游reader报告的可用credit数量,下文有此变量的分析)。
通过跟踪我们发现最底层调用的是CreditBasedPartitionRequestClientHandlernotifyCreditAvailable。代码如下所示:

@Override
public void notifyCreditAvailable(final RemoteInputChannel inputChannel) {
    ctx.executor().execute(() -> ctx.pipeline().fireUserEventTriggered(inputChannel));
}

这段代码发送了一个userEvent。
接下来
CreditBasedPartitionRequestClientHandleruserEventTriggered会得到响应,调用处理notifyCreditAvailable逻辑。代码如下:

@Override
public void userEventTriggered(ChannelHandlerContext ctx, Object msg) throws Exception {
    if (msg instanceof RemoteInputChannel) {
        boolean triggerWrite = inputChannelsWithCredit.isEmpty();

        // 加入inputChannelsWithCredit队列
        inputChannelsWithCredit.add((RemoteInputChannel) msg);

        // 如果入队之前队列为空,调用writeAndFlushNextMessageIfPossible方法
        // 发送AddCredit请求到server端
        if (triggerWrite) {
            writeAndFlushNextMessageIfPossible(ctx.channel());
        }
    } else {
        ctx.fireUserEventTriggered(msg);
    }
}

我们跟踪到writeAndFlushNextMessageIfPossible方法。发现如下内容:

private void writeAndFlushNextMessageIfPossible(Channel channel) {
    if (channelError.get() != null || !channel.isWritable()) {
        return;
    }

    while (true) {
        // 从inputChannelsWithCredit获取一个InputChannel
        RemoteInputChannel inputChannel = inputChannelsWithCredit.poll();

        // The input channel may be null because of the write callbacks
        // that are executed after each write.
        if (inputChannel == null) {
            return;
        }

        //It is no need to notify credit for the released channel.
        // 如果channel没有被释放,构造一个AddCredit请求并发送
        if (!inputChannel.isReleased()) {
            AddCredit msg = new AddCredit(
                inputChannel.getPartitionId(),
                // 此处获取并清零RemoteInputChannel的unannouncedCredit
                // unannouncedCredit为尚未向reader上报的可用credit数量
                // 下文有详细分析
                inputChannel.getAndResetUnannouncedCredit(),
                inputChannel.getInputChannelId());

            // Write and flush and wait until this is done before
            // trying to continue with the next input channel.
            channel.writeAndFlush(msg).addListener(writeListener);

            return;
        }
    }
}

上游接收并处理AddCredit请求的过程

CreditBasedSequenceNumberingViewReader在Netty的 Server端运行,负责维护下游和subpartitionView的对应关系。每一次调用requestSubpartitionView都会创建出一个CreditBasedSequenceNumberingViewReader

CreditBasedSequenceNumberingViewReader增加credit的逻辑在PartitionRequestServerHandlerchannelRead0方法中。消费端发送AddCredit消息之后会被此handler读取到,进行如下操作(无关代码已省略):

// ...
// 如果接收到的消息是AddCredit(增加credit)
else if (msgClazz == AddCredit.class) {
    AddCredit request = (AddCredit) msg;
    
    // 调用addCredit方法
    outboundQueue.addCredit(request.receiverId, request.credit);
}
// ...

这里outboundQueuePartitionRequestQueue。我们分析下它的addCredit方法。代码如下:

void addCredit(InputChannelID receiverId, int credit) throws Exception {
    if (fatalError) {
        return;
    }

    // 根据receiverId获取reader
    NetworkSequenceViewReader reader = allReaders.get(receiverId);
    if (reader != null) {
        // 调用reader的增加credit方法
        reader.addCredit(credit);

        // 可用reader入队
        enqueueAvailableReader(reader);
    } else {
        throw new IllegalStateException("No reader for receiverId = " + receiverId + " exists.");
    }
}

接下来跟踪到reader.addCredit(credit)调用。我们看下CreditBasedSequenceNumberingViewReaderaddCredit方法:

@Override
public void addCredit(int creditDeltas) {
    numCreditsAvailable += creditDeltas;
}

CreditBasedSequenceNumberingViewReader有一个numCreditsAvailable变量,用于记录该reader可用的credit数量。

回到enqueueAvailableReader方法。该方法将reader加入到可用reader队列中并发送此reader对应subpartitionView的buffer到下游。它的代码如下:

private void enqueueAvailableReader(final NetworkSequenceViewReader reader) throws Exception {
    // 如果reader已注册为可用(调用过enqueueAvailableReader)或者reader本身不可用,直接返回。这两个方法后续分析
    if (reader.isRegisteredAsAvailable() || !reader.isAvailable()) {
        return;
    }
    // Queue an available reader for consumption. If the queue is empty,
    // we try trigger the actual write. Otherwise this will be handled by
    // the writeAndFlushNextMessageIfPossible calls.
    // 如果availableReader队列在添加reader之前为空,需要触发数据发送操作
    boolean triggerWrite = availableReaders.isEmpty();
    // 注册此reader为可用reader
    registerAvailableReader(reader);

    if (triggerWrite) {
        // 写入reader对应的subpartitionView到下游task
        writeAndFlushNextMessageIfPossible(ctx.channel());
    }
}

enqueueAvailableReaderisAvailable方法返回该reader的数据是否可以发送到下游。代码如下:

@Override
public boolean isAvailable() {
    // BEWARE: this must be in sync with #isAvailable(BufferAndBacklog)!
    // 如果可用credit大于0,并且subpartitionView也可用的时候返回true
    if (numCreditsAvailable > 0) {
        return subpartitionView.isAvailable();
    }
    else {
        // 或者说subpartitionView将要读取的下一个buffer是event类型
        // 意思是event类型的数据无视是否有可用credit,无条件发送给下游task
        return subpartitionView.nextBufferIsEvent();
    }
}

我们在看看registerAvailableReader方法。

private void registerAvailableReader(NetworkSequenceViewReader reader) {
    // 添加reader到availableReaders队列
    availableReaders.add(reader);
    // 设置reader已注册为可用的标记为true
    reader.setRegisteredAsAvailable(true);
}

getNextBuffer方法,numCreditsAvailable 减一之后判断是否还有可用的credit,如果没有则抛出IllegalStateException。代码如下:

@Override
public BufferAndAvailability getNextBuffer() throws IOException, InterruptedException {
    BufferAndBacklog next = subpartitionView.getNextBuffer();
    if (next != null) {
        sequenceNumber++;

        if (next.buffer().isBuffer() && --numCreditsAvailable < 0) {
            throw new IllegalStateException("no credit available");
        }

        return new BufferAndAvailability(
            next.buffer(), isAvailable(next), next.buffersInBacklog());
    } else {
        return null;
    }
}

RemoteInputChannel的unannouncedCredit变量

unannouncedCredit统计了RemoteInputChannel暂时还没有向上游reader报告的可用credit数量。该统计字段在如下情况会增加:

  • 调用recycle方法:内存缓存片段(MemorySegment)被回收的时候。
  • 调用notifyBufferAvailable方法:从BufferPool请求Buffer失败会注册一个BufferListener。当Listener发现有Buffer恢复可用的时候会调用此方法。详细参见Flink 源码之节点间通信

RemoteInputChannel还有一个获取并清零unannouncedCredit的方法getAndResetUnannouncedCredit。该方法的唯一调用在CreditBasedPartitionRequestClientHandler类的writeAndFlushNextMessageIfPossible方法。此方法在上面已经分析过,不再赘述。

最后编辑于
©著作权归作者所有,转载或内容合作请联系作者
  • 序言:七十年代末,一起剥皮案震惊了整个滨河市,随后出现的几起案子,更是在滨河造成了极大的恐慌,老刑警刘岩,带你破解...
    沈念sama阅读 159,015评论 4 362
  • 序言:滨河连续发生了三起死亡事件,死亡现场离奇诡异,居然都是意外死亡,警方通过查阅死者的电脑和手机,发现死者居然都...
    沈念sama阅读 67,262评论 1 292
  • 文/潘晓璐 我一进店门,熙熙楼的掌柜王于贵愁眉苦脸地迎上来,“玉大人,你说我怎么就摊上这事。” “怎么了?”我有些...
    开封第一讲书人阅读 108,727评论 0 243
  • 文/不坏的土叔 我叫张陵,是天一观的道长。 经常有香客问我,道长,这世上最难降的妖魔是什么? 我笑而不...
    开封第一讲书人阅读 43,986评论 0 205
  • 正文 为了忘掉前任,我火速办了婚礼,结果婚礼上,老公的妹妹穿的比我还像新娘。我一直安慰自己,他们只是感情好,可当我...
    茶点故事阅读 52,363评论 3 287
  • 文/花漫 我一把揭开白布。 她就那样静静地躺着,像睡着了一般。 火红的嫁衣衬着肌肤如雪。 梳的纹丝不乱的头发上,一...
    开封第一讲书人阅读 40,610评论 1 219
  • 那天,我揣着相机与录音,去河边找鬼。 笑死,一个胖子当着我的面吹牛,可吹牛的内容都是我干的。 我是一名探鬼主播,决...
    沈念sama阅读 31,871评论 2 312
  • 文/苍兰香墨 我猛地睁开眼,长吁一口气:“原来是场噩梦啊……” “哼!你这毒妇竟也来了?” 一声冷哼从身侧响起,我...
    开封第一讲书人阅读 30,582评论 0 198
  • 序言:老挝万荣一对情侣失踪,失踪者是张志新(化名)和其女友刘颖,没想到半个月后,有当地人在树林里发现了一具尸体,经...
    沈念sama阅读 34,297评论 1 242
  • 正文 独居荒郊野岭守林人离奇死亡,尸身上长有42处带血的脓包…… 初始之章·张勋 以下内容为张勋视角 年9月15日...
    茶点故事阅读 30,551评论 2 246
  • 正文 我和宋清朗相恋三年,在试婚纱的时候发现自己被绿了。 大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
    茶点故事阅读 32,053评论 1 260
  • 序言:一个原本活蹦乱跳的男人离奇死亡,死状恐怖,灵堂内的尸体忽然破棺而出,到底是诈尸还是另有隐情,我是刑警宁泽,带...
    沈念sama阅读 28,385评论 2 253
  • 正文 年R本政府宣布,位于F岛的核电站,受9级特大地震影响,放射性物质发生泄漏。R本人自食恶果不足惜,却给世界环境...
    茶点故事阅读 33,035评论 3 236
  • 文/蒙蒙 一、第九天 我趴在偏房一处隐蔽的房顶上张望。 院中可真热闹,春花似锦、人声如沸。这庄子的主人今日做“春日...
    开封第一讲书人阅读 26,079评论 0 8
  • 文/苍兰香墨 我抬头看了看天上的太阳。三九已至,却和暖如春,着一层夹袄步出监牢的瞬间,已是汗流浃背。 一阵脚步声响...
    开封第一讲书人阅读 26,841评论 0 195
  • 我被黑心中介骗来泰国打工, 没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留,地道东北人。 一个月前我还...
    沈念sama阅读 35,648评论 2 274
  • 正文 我出身青楼,却偏偏与公主长得像,于是被迫代替她去往敌国和亲。 传闻我的和亲对象是个残疾皇子,可洞房花烛夜当晚...
    茶点故事阅读 35,550评论 2 270

推荐阅读更多精彩内容