FFmpeg、FFprobe、FFplay命令行使用

        因为正在学习音视频,从当当买了关于FFmpeg的书,在家补充知识。遇到了一些命令行的使用,我把它从书上移到笔记上,方便于下次查看,也方便网友查看。

书籍是人类进步的阶梯 ----高尔基

ffprobe

        ffprobe查看一个音频的文件:
        ffprobe ~/Downloads/2018121023.mp3

        ffpeobe查看一个视频的文件
        ffprobe ~/Downloads/2018121051.mp4
键入上述命令之后,可以看到第一部分的信息是Metadata信息:

Metadata:
        major_brand: jsom
        minor_version: 512
        compatible_brands: isomiso2avc1mp41
        encoder: Lavf55.12.100

        这行信息表明了该文件的Metadata信息,比如encoder是Lavf55.12.100,其中Lavf代表的是FFmpeg输出的文件,后面的编号代表了FFmpeg的版本代号,接下来的一行信息如下:

        Duration: 00:04:34.560 start: 0.023220, bitrate: 577kb/s

        上面的一行的内容表示Duration是4分34秒560毫秒,开始播放的时间是从23ms开始播放的,整个文件的比特率是577Kbit/s,紧接着再来看下一行:

Stream#0:0 (un): Video:h264 (avc1/0x31637661), yuv420p, 480*480, 508kb/s, 24fps

        这行信息表示第一个stream是视频流,编码方式是H264的格式(封装格式是AVC1),每一帧的数据表示是YUV420P的格式,分辨率是480*480,这路流的比特率是508Kbit/s,帧率是每秒钟24帧,紧接着再来看下一行:

Stream#0:1 (und):Audio: aac(LC)(mp4a/0x6134706D), 44100Hz, stereo, fltp, 63kb/s

        这行信息表示第二个stream是音频流,编码方式是AAC(封装格式是MP4A),并且采用的Profile是LC规格,采样率是44100Hz,声道数是立体声,数据表示格式是浮点型,这路音频流的比特率是63Kbit/s。

        ffprobe -show_format ~/Downloads/2018121051.mp4
        上述命令可以输出格式信息format_name、时间长度duration、文件大小size、比特率bit_rate、流的数目nb_streams等。

        ffprobe -print_format json -show_streams 2018121051.mp4
        上述命令可以以JSON格式的形式输出具体每一个流最详细的信息,视频中会有视频的宽高信息、是否有b帧、视频帧的总数目、视频的编码格式、显示比例、比特率等信息,音频中会有音频的编码格式、表示格式、声道数、时间长度、比特率、帧的总数目等信息。

        ffprobe显示帧信息的命令:
        ffprobe -show_frames 2018121051.mp4

        ffprobe查看包信息的命令:
        ffprobe -show_packets 2018121051.mp4

日常生活中会接触到一些多媒体文件存在3行Stream
的情况。
视频Stream: h264 yuv420P
音频Stream: aac 48000Hz stereo fltp (default) title: 粤语
音频Stream: aac 48000Hz stereo fltp title: 国语
这说明,该媒体文件中有三路流:一路是视频流,另外两路流是音频流,默认播放的是粤语的音频流,在大多数的播放器里面都可以进行音频流的切换,可以切换到国语的音频流进行观看。

ffplay

        ffplay播放一个音频文件:
        ffplay ~/Downloads/2018121023.mp3

        这时会弹出一个窗口,一边播放MP3文件,一边将播放声音的语谱图画到该窗口上。针对该窗口的操作如下,点击窗口的任意一个位置,ffplay会按照点击的位置计算出时间的进度,然后跳(seek)到这个时间点上继续播放;按下键盘上的右键会默认快进10s,左键默认后退10s,上键默认快进1min,下键默认后退1min;按ESC键就是退出播放进程;如果按w键则将绘制音频的波形图等。

        ffplay播放一个视频文件:
        ffplay ~/Downloads/2018121051.mp4

        这时会直接在新弹出的窗口上播放该视频,如果按下s键则可以进入frame-step模式,即按s键一次就会播放下一帧图像。

        ffplay 2018121051.mp4 -loop 10
        上述命令代表播放视频结束之后会从头再次播放,共循环播放10次。

        ffplay 大话西游.mkv -vst 1
        上文最后提到的两路音频流,ffplay可以指定使用哪一路音频流或者视频流。上述命令表示播放视频中的第一路视频流,如果参数vst后面跟的是2,那么就播放第二路视频流,但是如果没有第二路视频流,就会是黑屏即什么都不显示。

        介绍一些开发工作中常用的几个命令,这些命令在工作中debug的时候非常有用。首先用ffplay播放裸数据,无论是音频的pcm文件还是视频帧原始格式表示的数据(YUV420P或者rgba)。先来看看音频pcm文件的播放命令:
        ffplay song.pcm -f s16le -channels 2 -ar 44100
        上述这行命令其实就可以正常播放song.pcm了,当然,前提是格式(-f)、声道数(-channels)、采样率(-ar)必须设置正确,如果其中一项参数设置不正确,都不会得到正常的播放结果。
        然后再来看一帧视频帧的播放,首先是YUV420P格式的视频帧:
ffplay -f rawvideo -pixel_format yuv420p -s 480480 texture.yuv
        其实对于一帧视频帧,或者更直接来说一张PNG或者JPEG的图片,直接用ffplay是可以显示或播放的,当然PNG或者JPEG都会在其头部信息里面指明这张图片的宽高以及格式表示。若想让ffplay显示一张YUV的原始数据表示的图片,那么需要告诉ffplay一些重要的信息,其中包括(-f rawvideo代表原始格式)、表示格式(-pixel_format yuv420p)、宽高(-s 480
480)。对于RGB表示的图像,其实是一样的,命令如下:
        ffplay -f rawvideo -pixel_format rgb24 -s 480*480 texture.rgb
        上述代码是播放rgb的原始数据,当然还需要指明前面提到的三项基本信息。

        对于视频播放器,不得不提的一个问题就是音画同步,在ffplay中音画同步的实现方式其实有三种,分辨是:以音频为主时间轴作为同步源;以视频为主时间轴作为同步源;以外部时钟为主时间轴作为同步源。ffplay中默认的对齐方式是以音频为基准进行对齐的,那么以音频对齐方式为基准是怎么实现的呢?
播放器接收到的视频帧或者音频帧,内部都会有时间戳(PTS时钟)来标识它实际应该在什么时候进行展示。实际的对齐策略如下:比较视频当前的播放时间和音频当前的播放时间,如果视频播放过快,则通过加大延迟或者重复播放来降低视频播放速度;如果视频播放慢了,则通过减小延迟或者丢帧来追赶音频播放的时间点。关键就在于音视频时间的比较以及延迟的计算,当然在比较的过程中会设置一个阀值(Threshold),若超过预设的阀值就应该做调整(丢帧渲染或者重复渲染),这就是整个对齐策略。
ffplay 2018121051.mp4 -sync audio 指定以音频为基准进行同步(默认)
ffplay 2018121051.mp4 -sync video 指定以视频为基准进行同步
ffplay 2018121051.mp4 -sync ext 指定以外部时钟为基准进行同步

ffmpeg

        如果说ffprobe是用于探测媒体文件的格式以及详细信息,ffplay是一个播放媒体文件的工具,那么ffmpeg就是强大的媒体文件转换工具。它可以转换任何格式的媒体文件,并且还可以用自己的AudioFilter以及VideoFilter进行处理和编辑。

通用参数

  • -f fmt: 指定格式(音频或者视频格式)。
  • -i filename: 指定输入文件名。
  • -y: 覆盖已有文件。
  • -t duration: 指定时长。
  • -fs limit_size: 设置文件大小的上限。
  • -ss limit_size: 从指定的时间(单位为秒)开始,也支持[-]hh:mm:ss[.xxx]格式
  • -re: 代表按照帧率发送。在作为推流工具的时候一定要加入该参数,否则ffmpeg会按照最高速率向流媒体服务器不停地发送数据。
  • -map: 指定输出文件的流映射关系。如果没有-map选项,则ffmpeg采用默认的映射关系。

视频参数

  • -b: 指定比特率(bit/s),ffmpeg是自动使用VBR的,若指定了该参数则使用平均比特率。
  • -bitexact: 使用标准比特率。
  • -vb: 指定视频比特率(bit/s).
  • -r rate: 帧速率(fps)。
  • -s size: 指定分辨率(320 * 320)
  • -aspect aspect: 设置视频长宽比(4:3,16:9或者1.3333,1.7777)。
  • -croptop size: 设置顶部切除尺寸(in pixels)。
  • -cropbottom size: 设置顶底切除尺寸(in pixels)。
  • -cropleft size: 设置左切除尺寸(in pixels)。
  • -cropright size: 设置右切除尺寸(in pixels)。
  • -padtop size: 设置顶部补齐尺寸(in pixels)。
  • -padbottom size: 设置底部补齐尺寸(in pixels)。
  • -padleft size:设置左补齐尺寸(in pixels)。
  • -padright size:设置右补齐尺寸(in pixels)。
  • -padcolor color: 补齐带颜色(000000-FFFFFF)。
  • -vn: 取消视频的输出。
  • -vcode codec: 强制使用codec编解码方式('copy'代表不进行重新编码)。

音频参数

  • -ab: 设置比特率(单位为bit/s)。
  • -aq quality: 设置音频质量(指定编码)。
  • -ar rate: 设置音频采样率(单位为Hz)。
  • -ac channels: 设置声道数。1就是单声道,2就是立体声。
  • -an: 取消音频轨。
  • -acodec codec: 指定音频编码('copy'代表不做音频转码)。
  • -vol volume: 设置录制音量大小(默认256)<百分比>。

1)列出ffmpeg支持的所有格式:
ffmpeg -formats

2)剪切一段媒体文件(可以是音频或者视频文件):
ffmpeg -i input.mp4 -ss 00:00:50.0 -codec copy -t 20 output.mp4
表示将文件input.mp4从第50s开始剪切20s的时间,输出到文件output.mp4中,其中-ss指定偏移时间(time Offset),-t 指定的时长(duration)。

3)提取一个视频文件中的音频文件:
ffmpeg -i input.mp4 -vn -acodec copy output.m4a

4)使一个视频中的音频静音,即只保留视频:
ffmpeg -i input.mp4 -an -vcodec copy output.mp4

5)从MP4文件中抽取视频流导出为裸H264数据:
ffmpeg -i input.mp4 -an -vcodec copy -bsf:v h264_mp4toannexb output.h264
上述指令里不使用音频数据(-an),视频数据使用mp4toannexb这个bitstream filter来转换为原始的H264数据。

6)使用AAC音频数据和H264的视频生成MP4文件:
ffmpeg -i test.aac -i test.h264 -acodec copy -bsf:a aac_adtstoasc -vcodec copy -f mp4 output.mp4
上述代码使用一个名为aac_adtstoasc的bitstream filter。

7)对音频文件的编码格式做转换:
ffmpeg -i input.wav -acodec libfdk_aac output.aac

8)从WAV音频文件中导出PCM裸数据:
ffmpeg -i input.wav -acodec pcm_s16le output.pcm
这样就可以导出用16个bit来表示一个sample的PCM数据了,并且每个sample的字节排列顺序都是小尾端表示的格式,声道数和采样率使用的都是原始WAV文件的声道数和采样率的PCM数据。

9)重新编码视频文件,复制音频流,同时封装到MP4格式的文件中:
ffmpeg -i input.flv -vcodec libx264 -acodec copy output.mp4

10)将一个MP4格式的视频转换为gif格式的动图:
ffmpeg -i input.mp4 -vf scale=100:-1 -t 5 -r 10 image.gif
上述命令按照分辨率比例不动宽度改为100(使用VideoFilter的scaleFilter),帧率改为10(-r),只处理前5秒钟(-t)的视频,生成gif。

11)将一个视频的画面部分生成图片:
ffmpeg -i output.mp4 -r 0.25 frames_%04d.png
上述命令每4秒截取一帧视频画面生成一张图片,生成的图片从frames_0001.png开始一直递增下去。

12)使用一组图片可以组成一个gif,如果你连拍了一组照片,可以用下面这行命令生成一个gif:
ffmpeg -i frames+%04d.png -r 5 output.gif

13)使用音量效果器,可以改变一个音频媒体文件中的音量:
ffmpeg -i input.wav -af 'volume=0.5' output.wav
上述命令是将音频文件中的声音减小一半,输出到output.wav文件中。

14)淡入效果器的使用:
ffmpeg -i input.wav -filter_complex afade=t=in:ss=0:d=5 output.wav
上述命令可以将input.wav文件中的前5s做一个淡入效果,输出到output.wav中。

15)淡出效果器的使用:
ffmpeg -i input.wav -filter_complex afade=t=out:st=200:d=5 output.wav
上述命令可以将input.wav文件从200s开始,做5秒的淡出效果,并放到output.wav文件中。

16)将两路声音进行合并:
ffmpeg -i vocal.wav -i accompany.wav -filter_complex amix=inputs=2:duration=shortest output.wav
上述命令是将vocal.wav和accompany.wav两个文件进行mix,按照时间长度较短的音频文件的时间长度作为最终输出的output.wav的时间长度。

17)对声音进行变速但不变调效果器的使用:
ffmpeg -i vocal.wav -filter_complex atempo=0.5 output.wav
上述命令将vocal.wav按照0.5倍的速度进行处理生成output.wav,时间长度会变成输入的2倍。但是音高是不变的,这就是大家常说的变速不变调。

18)为视频增加水印的效果:
ffmpeg -i input.mp4 -i icon.png -filter_complex '[0:v][1:v]overlay=main_w-overlay_w-10:10:1[out]' -map '[out]' output.mp4
上述命令包含了几个内置参数,main_w代表主视频宽度,overlay_w代表水印宽度,main_h代表主视频高度,overlay_h代表水印高度。

19)视频提亮效果器的使用:
ffmpeg -i input.mp4 -c:v libx264 -b:v 800k -c:a libfdk_aac -vf eq=brightness=0.25 -f mp4 output.mp4
提亮参数是brightness,取值范围是从-1.0到1.0,默认值是0;
对比度参数是contrast,取值范围是从-2.0到2.0,默认值是1.0;

20)视频旋转效果器的使用:
ffmpeg -i input.mp4 -vf "transpose=1: -b:v 600k output.mp4

21)视频裁剪效果器的使用:
ffmpeg -i input.mp4 -an -vf "crop=240:480:120:0" -vcodec libx264 -b:v 600k output.mp4
参数crop=width:height:x:y,其中 width 和 height 表示裁剪后的尺寸,x:y 表示裁剪区域的左上角坐标。

22)将一张RGBA格式表示的数据转换为JPEG格式的图片:
ffmpeg -f rawvideo -pix_fmt rgba -s 480*480 -i texture.rgb -f image2 -vcodec mjpeg output.jpg

23)将一个YUV格式表示的数据转换为JPEG格式的图片:
ffmpeg -f rawvideo -pix_fmt yuv420p -s 480*480 -i texture.yuv -f image2 -vcodec mjpeg output.jpg

24)将一段视频推送到流媒体服务器上:
ffmpeg -re -i input.mp4 -acodec copy -vcodec copy -f flv rtmp://xxxxx
上述代码中,rtmp:xxxx代表流媒体服务器的地址,加上-re参数代表将实际媒体文件的播放速度作为推流速度进行推送。

25)将流媒体服务器上的流dump到本地:
ffmpeg -i http://xxx/xxx.flv -acodec copy -vcodec copy -f flv output.flv

26)将两个音频文件以两路流的形式封装到一个文件中,比如在K歌的应用场景中,原伴唱实时切换的场景下,可以使用一个文件包含两路流,一路是伴奏流,另外一路是原唱流:
ffmpeg -i input_1.mp3 -i input_2.mp3 -map 0:a -c:a:0 libfdk_aac -b:a:0 96k -map 1:a -c:a:1 libfdk_aac -b:a:1 64k -vn -f mp4 ouput.m4a

参考文献

《音视频开发进阶指南》
《FFmpeg从入门到精通》

手打下来不容易,点个喜欢呗~

推荐阅读更多精彩内容