FFmpeg代码导读系列(一,下半部)----HEVC在RTMP中的扩展

原文首发在LiveVideoStack,请从原文转载,本文不接受再次转载!

阅读本文前,请先阅读上半部分:FFmpeg代码导读系列(一)----基础篇

金山云多媒体SDK团队在移动直播、短视频等项目中遇到了许多FFmpeg问题,特设立《FFmpeg从入门到出家》系列文稿,希望博君一笑的同时,能让大家对FFmpeg有更深入的了解。

先在前面

FFmpeg社区曾经有过一次针对RTMP扩展HEVC的讨论,最终达成的结论是如果Adobe扩展了RTMP,那么FFmpeg才可以接受HEVC扩展。现状是Adobe更新RTMP协议遥遥无期。

随着iOS 11HEVC的支持,还有Android芯片对H.265的支持。在移动平台支持场景下,使用更高效率的视频编码,在相同带宽负载情况下,能提供更优质的直播体验。可以阅读《基于iOS11的HEVC(H.265)硬编码/硬解码功能开发指南》了解iOS对HEVC的支持情况。

如果你也认可这个思路,那么你可以参考本文,在基于RTMP协议推流或者拉流中,体验H.265/HEVC带来的用户体验提升!

4. HEVC在RTMP中的扩展

为推进HEVC视频编码格式在直播方案中的落地,经过CDN联盟讨论,并和主流云服务厂商达成一致,规范了HEVCRTMP/FLV中的扩展,具体修改内容见下。

4.1 FLV规范扩展

HEVC为视频编码格式,因此对FLV规范的扩展,只集中在Video Tag,其它部分,无任何改动。

4.1.1 支持HEVC的VideoTagHeader

扩展后的VideoTagHeader如下图所示(红色字体为新增内容):

支持HEVC的FLVTagHeader.png

修改点如下:

  1. CodecID - 定义HEVC格式的值为12;

  2. HEVCPacketType - 当CodecID == 12时,AVCPacketType为HEVCPacketType:

    • 如果HEVCPacketType为0,表示HEVCVIDEOPACKET中存放的是HEVC sequence header;
    • 如果HEVCPacketType为1,表示HEVCVIDEOPACKET中存放的是HEVC NALU;
    • 如果HEVCPacketType为2,表示HEVCVIDEPACKET中存放的是HEVC end of sequence,即HEVCDecoderConfigurationRecord;
  3. CompositionTime - 当CodecID == 12时,同样需要CompositionTime

4.1.2 支持HEVC的VideoTagBody

当CodecID为12时,VideoTagBody中存放的就是HEVC视频帧内容。

扩展后的VideoTagBody如下图所示(红色字体为HEVC新增内容):

支持HEVC的VideoTagBody.png

4.2 FFmpeg中的修改

我们已在FFmpeg的各个版本上提供相关的完整修改,具体参见:https://github.com/ksvc/FFmpeg, 完整patch获取及相关说明见:https://github.com/ksvc/FFmpeg/wiki

由第二章节的阐述可知,FLV的解复用和复用功能代码分别在libavformt/flvdec.clibavformat/flvenc.c中,扩展后的修改也都集中在这两个文件。本节将在FFmpeg3.3的基础上,说明修改的关键点。

4.2.1 编码类型定义

libavformat/flv.h中按照VideoTagHeader中的CodecID定义了一组视频编码格式的枚举值,扩展后的枚举定义如下:

enum {
    FLV_CODECID_H263    = 2,
    FLV_CODECID_SCREEN  = 3,
    FLV_CODECID_VP6     = 4,
    FLV_CODECID_VP6A    = 5,
    FLV_CODECID_SCREEN2 = 6,
    FLV_CODECID_H264    = 7,
    FLV_CODECID_REALH263= 8,
    FLV_CODECID_MPEG4   = 9,
    FLV_CODECID_HEVC   = 12,
};

4.2.2 FLV demux

在解复用过程中,flv_read_packet方法是整个过程的核心,它里面完成了对每个Tag的读取和解析。

4.1.1中提到,当如果HEVCPacketType为0时,表示HEVCVIDEOPACKET中存放的是HEVC sequence header,也就是HEVCDecoderConfigurationRecord,解码时需设置HEVCDecoderConfigurationRecord方能正确解码。

HEVCAVC视频帧在FLV中的存放格式相同,所以只需在读取Video Tag的地方增加AV_CODEC_ID_HEVC的判断条件即可,调整后的代码如下

if (st->codecpar->codec_id == AV_CODEC_ID_AAC ||
    st->codecpar->codec_id == AV_CODEC_ID_H264 ||
    st->codecpar->codec_id == AV_CODEC_ID_HEVC ||
    st->codecpar->codec_id == AV_CODEC_ID_MPEG4) {
    int type = avio_r8(s->pb);
    size--;
    if (st->codecpar->codec_id == AV_CODEC_ID_H264 ||
         st->codecpar->codec_id == AV_CODEC_ID_HEVC ||
         st->codecpar->codec_id == AV_CODEC_ID_MPEG4) {
         // sign extension
         int32_t cts = (avio_rb24(s->pb) + 0xff800000) ^ 0xff800000;
         pts = dts + cts;
         if (cts < 0) { // dts might be wrong
             if (!flv->wrong_dts)
                av_log(s, AV_LOG_WARNING,
                        "Negative cts, previous timestamps might be wrong.\n");
            flv->wrong_dts = 1;
        } else if (FFABS(dts - pts) > 1000*60*15) {
           av_log(s, AV_LOG_WARNING,
                       "invalid timestamps %"PRId64" %"PRId64"\n", dts, pts);
           dts = pts = AV_NOPTS_VALUE;
        }
   }

   if (type == 0 && (!st->codecpar->extradata ||
       st->codecpar->codec_id == AV_CODEC_ID_AAC ||
       st->codecpar->codec_id == AV_CODEC_ID_HEVC ||
       st->codecpar->codec_id == AV_CODEC_ID_H264)) {
       AVDictionaryEntry *t;
       if (st->codecpar->extradata) {
           if ((ret = flv_queue_extradata(flv, s->pb, stream_type, size)) < 0)
               return ret;
           ret = FFERROR_REDO;
           goto leave;
       }
       if ((ret = flv_get_extradata(s, st, size)) < 0)
           return ret;
       ……
   }
}

AVCDecoderConfigurationRecordHEVCDecoderConfigurationRecord都是存放在AVStream->AVCodecParameter->extradata中。

4.2.3 FLV mux

FLV mux的修改相对较多、header、packet、trailer中均有涉及。

4.2.3.1 write header

flv_write_header中主要完成了以下工作:

  1. 写入FLV Header;
  2. 写入Metadata;
  3. 如果音频编码格式为AAC,则写入第一个Audio Tag,其AudioTagBody中存放的是AAC sequence header;
  4. 如果视频编码格式为AVC,则写入第一个Video Tag,其中VideoTagBody中存放的是AVC sequence header。

同样,当视频编码格式HEVC时,也要写入第一个VideoTag,其中VideoTagBody中存放的是HEVCDecoderConfigurationRecord修改点如下

avio_w8(pb, par->codec_tag | FLV_FRAME_KEY); // flags
avio_w8(pb, 0); // AVC sequence header
avio_wb24(pb, 0); // composition time

if (par->codec_id == AV_CODEC_ID_HEVC)
       ff_isom_write_hvcc(pb, par->extradata, par->extradata_size, 0);
else
       ff_isom_write_avcc(pb, par->extradata, par->extradata_size);

ff_isom_write_hvcc的作用是将extradata转为HEVCDecoderConfigurationRecord结构并写入。

4.2.3.2 write packet

flv_write_packet的作用是写入音视频帧,其中有关写入video数据的地方,都需要加上AV_CODEC_ID_HEVC的判断条件,修改内容如下:

    else if (par->codec_id == AV_CODEC_ID_HEVC ){
        if (par->extradata_size > 0 && *(uint8_t*)par->extradata != 1)
            if ((ret = ff_hevc_annexb2mp4_buf(pkt->data, &data, &size, 0, NULL)) < 0)
                return ret;
    }

ff_hevc_annexb2mp4_buf方法的作用是将Annex-B格式的HEVC视频帧转为HVCC格式。

AnnexB与AVCC/HVCC的区别在于参数集与帧格式,AnnexB的参数集sps、pps以NAL的形式存在码流中(带内传输),以startcode分割NAL。而HVCC 的参数集存储在extradata中(带外传输),使用NALU长度(固定字节,通常为4字节,从extradata中解析)分隔NAL。

4.2.3.3 write trailer

结束时需要写入HEVC end of sequence,其格式与AVC end of sequence相同,直接复用即可,flv_write_trailer的修改内容如下:

 if (par->codec_type == AVMEDIA_TYPE_VIDEO &&
           (par->codec_id == AV_CODEC_ID_H264 || par->codec_id == AV_CODEC_ID_HEVC || par->codec_id == AV_CODEC_ID_MPEG4))
                put_avc_eos_tag(pb, sc->last_ts);

5. 结束语

本文只是简单介绍了如何在FFmpeg中扩展rtmp协议对HEVC编码格式的支持,而要将HEVC应用于直播整体方案,除推流端和播放端要提供相应能力外,源站、CDN、转码服务同样都需要提供这种能力。金山云直播整体方案,已完全支持HEVC视频编码格式,欢迎大家使用。

客户端的直播/短视频SDK,在适配了系统的HEVC硬编/解码能力外,还提供了高效的HEVC软编/解码方案,如果您感兴趣,可联系我们咨询或讨论。

推荐阅读更多精彩内容