【译】重要的图像优化之三:“素人”JPEG上

注明:本人原创翻译,原版为Essential Image Optimization电子书,这里将其拆分为几篇文章发布。另外,文中部分链接可能会因为“网络”原因无法打开。不必着急,我会慢慢将其中一些比较好的内容翻译过来发表,都会在这个“Web图像技术深究”专题中。

目录

正文:

“素人”JPEG

JPEG可能是世界上使用最广泛的图像格式。如前所述,HTTP Archive抓取的站点上看到的图像中有45%是JPEG格式。您的手机、数码相机、旧的网络摄像机——一切的设备都支持这种编解码器。它也很确实很古老,第一次发布可以一直追溯到1992年。在这期间,已经有很多人进行了大量研究,试图改进它,让它变得更好。

JPEG是一种有损压缩算法,它丢弃信息以节省存储空间,并在尝试保持文件尽可能小的同时保留图像质量的方面做出了许多努力。

你的用例可以接受什么样的图像质量?

像JPEG这样的格式最适用于那些具有多个颜色区域的照片或图像。而且大多数优化工具都允许您设置您喜欢的压缩级别;较高级别的压缩可以减小文件的大小,但可能会引起重影、光晕或马赛克等失真效果。

Modern-Image5.jpg

JPEG: 从最佳质量转变到最低质量时,可以感觉到的压缩影响可能会增加。请注意,不同工具中的质量得分可能会有较大的差异。

选择什么样的质量设置,请根据你的业务需求:

  • 最高质量:在质量要求远比带宽重要时使用。可能是因为这个图片在你的设计中很重要或者它需要全分辨率显示。
  • 一般质量:当你追求较小的图片,但又不想对图片质量产生较大影响时使用。你的用户可能仍然希望看到的图片比较清晰。
  • 较低质量:当网络带宽更重要时使用。这些图片更适用于不稳定或带宽较低的网络。
  • 最低质量:节省带宽是至关重要时使用。用户可以接受一个较差的视觉体验,以便更快速的加载页面。

下面,我们来谈谈JPEG的压缩模式,因为它们对图片的视觉体验有很大的影响。

注意:我们有时有可能会高估用户需要的图像质量。图像质量可能被认为是高保真资源的一个偏差值。但它同样也可以是很主观的。

JPEG的压缩模式

JPEG图像格式具有多种不同的压缩模式。其中,三种流行的模式分别是基线(顺序),渐进式JPEG(PJPEG)和无损。

基线(或顺序)JPEG和渐进式JPEG有什么不同?

基线JPEG(大多数图像编辑和优化工具的默认项)以相对简单的方式进行编码和解码:从上到下。当基线JPEG加载缓慢时,用户会先看到图像的顶部,然后更多的图像将在图像逐步加载时显示。无损JPEG与基线JPEG类似,但具有更小的压缩比。

Modern-Image6.jpg

基线JPEG是从顶部到底部加载,而渐进式JPEG是从模糊到清晰。

而渐进式JPEG则是将图片进行多次扫描。第一次扫描会以模糊或低质量显示图片,后面多次扫描可逐步提高图像质量,这便是“渐进式”的意义。图像的每个“扫描”增加了更多的图片细节。最终组合时,就会创建一个最终质量的图像。

Modern-Image7.jpg
基线JPEG从上到下加载图像,而PJPEG从低分辨率(模糊)加载到高分辨率。Pat Meenan曾经写过写了一个交互式工具来测试和分析渐进式JPEG扫描。

无损JPEG是通过删除由数码相机或编辑器添加的EXIF数据、优化一个图片的霍夫曼编码或者重新扫描图像等手段实现的。诸如jpegtran等工具都可以通过重新排列压缩数据而无需图像降级来实现无损压缩。jpegrescanjpegoptimmozjpeg(我们将在稍后介绍)同样也支持无损JPEG压缩。

渐进式JPEG的优点

PJPEGs能提供图像低分辨率“预览”功能,可以提高用户的使用体验:用户会感觉图像的加载速度更快。

在较慢的3G网络连接中,这允许用户在只收到一部分文件时就可以(大概)看到图像中的内容,并确定是否等待它完全加载完成。这会比基线JPEG所提供的图像从上到下显示方式让人更加乐于接受。

pjpeg-graph.jpg
在2015年,Facebook更新图像到PJPEG(用于iOS应用程序)后,数据使用量下降了10%。通过优化感知加载时间,Facebook能够比快15%的速度加载优质图像,如上图所示。

PJPEG还可以提高图像压缩率;同样10KB以上的图像,渐进式JPEG比基线JPEG可以节省2-10%的带宽。渐进式JPEG有较高压缩比,是由于JPEG中的每个扫描都能够拥有自己专用的可选霍夫曼编码。现代化的JPEG编码器(例如libjpeg-turbo,MozJPEG等)都是利用了PJPEG的灵活性,更好地打包图像数据。

注意:为什么PJPEG的压缩更好?因为基线JPEG的所有块是一次性压缩编码的。而在PJPEG中,利用一种类似离散余弦变换系数的方法可以将多个不连续的块编码在一起,从而带来更好的压缩比率。

谁在生产环境中使用了渐进式JPEG?

  • Twitter.com:推特使用了质量基准为85%的渐进式JPEG。通过他们对用户延迟感知(首次扫描的时间和总体加载时间)的测试显示,总体而言,PJPEG在解决他们对较低的文件大小和可接受范围内的转码及解码时间的需求方面具有很强的竞争力。
  • Facebook:脸书为他们的iOS应用使用了渐进式JPEG。他们发现数据的使用量减少了10%,并且他们载入高质量图像的速度提高了15%。
  • Yelp:在切换到渐进式JPEG后,发现他们的图像尺寸减少了4.5%。另外,他们还使用MozJPEG节省了13.8%的额外费用。

包括许多以图片为核心业务的网站,比如Pinterest同样都是在生产环境中使用渐进式JPEG。

pinterest-loading.jpg

Pinterest的JPEG图像都使用了渐进式模式的编码。这可以通过多次扫描来加载来,优化用户体验。

渐进式JPEG的缺点

PJPEG解码速度更慢:有时候甚至多出3倍的时间。在具有强大CPU的台式机上,这种差异可能无法感觉到,但在性能有限的移动设备上就会很明显。为了不完整的图层可以正常工作,这需要对图像进行多次解码,而每次解码都需要消耗一定的CPU运算周期。

渐进式JPEG也并不总是更小:对于一些非常小的图像(如缩略图),渐进式JPEG的文件可能反而会大于基线JPEG。而且,对于这样小的缩略图,渐进渲染并没有什么意义。

这意味着,你在决定是否使用PJPEG时,需要进行一些测试,并找到文件大小、网络延迟和CPU周期使用的平衡点。

注意: PJPEG(和所有JPEG)有时可以在移动设备上进行硬件解码。它不会改善图片在内存中的大小,但它可以解决一些CPU负载的问题。但是并不是所有的Android设备都具有硬件加速支持;但是高端设备都会支持,所有的iOS设备也都支持。

有些用户可能会认为渐进式加载是一个缺点,因为当图像完成加载时可能会变得很难分辨。由于每个受众的感官差异很大,在使用PJPEG时请评估它对自己用户的体验是否有意义。

如何生成一个渐进式JPEG?

很多工具和库都支持导出渐进式JPEG,比如ImageMagick, libjpeg, jpegtran, jpeg-recompress以及imagemin。如果你已经有了一个现有的图片优化方案,那么增加渐进式图片加载支持可能是非常容易的:

const gulp = require('gulp');
const imagemin = require('gulp-imagemin');

gulp.task('images', function () {
    return gulp.src('images/*.jpg')
        .pipe(imagemin({
            progressive: true
        }))
        .pipe(gulp.dest('dist'));       
});

大多数的图像编辑工具默认情况下都是将图像保存为基线式。

photoshop.jpg
默认情况下,大多数图像编辑工具将图像保存为基线JPEG文件。在Photoshop中您可以通过选择文件 - >导出 - >保存为Web(旧版),然后选中Progressive选项,将您在Photoshop中创建的任何图像保存为渐进式JPEG。Sketch也支持导出渐进式JPEG。通过选择导出为JPG,并在保存图像的同时选中“Progressive”复选框。

色度(或颜色)抽样

我们的眼睛相对于图像中的光亮度(或者luma—一种光亮度量单位)损失来说,更易忽略图像(色度)中的颜色细节的损失。色度抽样是一种压缩方式,通过在色差通道上进行较低(相对亮度通道)清晰度的抽样从而可以减少文件大小,在某些情况下可减少15-17%,而不会对图像质量产生影响,这是JPEG图像的一个压缩选项。抽样同时也可以减少显示图像时对内存的占用。

luma-signal.jpg

同我们看到的图片中的形状相比,定义它的亮度(luma)反而是非常重要的。比较旧的或经过过滤的黑白照片可能并不包含颜色,但是由于亮度的作用,这些照片与有颜色的照片一样能表现各种细节。色度(色彩)其实对视觉感受影响是较小的。

no-subsampling.jpg
JPEG支持多种不同的子采样类型,包括:无、水平和水平并垂直。这个图是来自FrédéricKayser的“JPEGs for the horseshoe crabs”。

在谈论色度抽样时,经常会提到一些常见的样本。一般来说有4:4:44:2:24:2:0。那么这些代表什么呢?假设样本采用格式A:B:C。A是一行中的像素数,对于JPEG来说这个值一般为4;B表示第一行中的颜色数量;C表示第二行中的颜色数量。

  • 4:4:4 —— 没有压缩,颜色和亮度被完全传输。
  • 4:2:2 —— 水平半抽样,垂直全部抽样。
  • 4:2:0 —— 第一行像素中的一半取样,并第二行忽略。

注意:jpegtran和cjpeg支持单独的亮度和色度的质量配置。通过添加-sample标志(例如-sample 2x1)。并且有一些常用的规则:subsampling(-sample 2x2)可以生成美妙的照片;no-subsampling(-sample 1x1)最适合于截图、横幅和按钮;最终的compromise(2x1)用于你不确定将图片使用在哪里。

通过减少色度分量中的像素,可以显著减小颜色分量的大小,从而最终减少图像文件的字节大小。

subsampling.jpg

质量为80的JPEG在Chrome中不同样本配置下的显示对比。

色度抽样值得被用于大多数类型的图像。但是它确实有一些例外:由于抽样依赖于我们眼中的视觉限制,当对于压缩图像而言,色彩细节可能与亮度(例如医学图像)一样重要时,使用色度抽样就不是很好。

另外,包含字体的图像也可能会受到明显的影响,因为文本的抽样可能会降低其可读性。而一些更为锐利的边缘也是难以被压缩的,因为色度取样是被设计为更好地处理具有更多软过渡的摄影场景。

Screen_Shot_2017-08-25_at_11.06.27_AM.jpg
了解JPEG”中建议在处理包含文本的图像时,使用4:4:4(1x1)的子样本配置。

提示:在JPEG规范中其实并没有规定Chroma子采样的确切方法,因此不同的解码器的处理方式可能不同。MozJPEG和libjpeg-turbo都是使用了缩放方法。而较旧版本的libjpeg使用了不同方法:在颜色中增加边缘震荡效应。

注意:Photoshop在使用“Save for web”功能时是自动设置色度抽样样本的。当图像质量设置在51-100之间时,根本不使用抽样(即样本4:4:4)。当质量低于此值时,将使用4:2:0进行抽样。这也就是将质量从51切换到50时,可以明显观察到的文件大小减少的一个原因。

注意:在抽样讨论中,常常提到YCbCr这个术语。这是一个可以表示伽玛校正的RGB颜色空间的模型。Y是伽马校正亮度,Cb是蓝色的色度分量,Cr是红色的色度分量。如果您查看ExifData,您将在采样级别旁边看到YCbCr。

如果想进一步了解色度抽样,请参阅《为什么你的图像不使用色度抽样?

JPEG引发的格式拓展

以下是网络上当前图像格式的情况:

总的来说——碎片化严重。我们经常需要有条件地为不同的浏览器提供不同的图像格式,以充分利用浏览器任何先进的功能。

format-comparison.jpg
不同的现代图像格式(和优化编码器)文件大小为26KB的对比演示。我们可以使用SSIM(结构相似性)或Butteraugli来比较质量,稍后我们将会详细介绍。

  • JPEG 2000 (2000) - 从基于离散余弦变换到基于小波的切换方式改进。浏览器支持:Safari桌面+ iOS。**
  • JPEG XR (2009) - 替代JPEG和JPEG 2000,支持 HDR和宽色域色彩空间。编码/解码速度比较慢,但是产生比JPEG更小的文件。浏览器支持:Edge,IE。
  • WebP (2010) - Google支持的基于块预测的图像格式,包括有损和无损压缩。WebP同时提供JPEG的字节压缩特性和一般文件较大PNG才能提供的透明度特性。但是不支持色度抽样和渐进式加载。另外解码也比JPEG解码速度慢。浏览器支持:Chrome,Opera。通过Safari和Firefox进行实验。
  • FLIF (2015) - 基于压缩比的一种无损图像格式,并声称胜过PNG、无损WebP、无损BPG和无损JPEG 2000。浏览器支持:无。注意,有一个JS浏览器解码器
  • HEIF和BPG。从压缩的角度来看,它们是一样的,但是有不同的包装:
  • BPG (2015) - 旨在基于HEVC(高效率视频编码)进行高效压缩的JPEG替代者。与MozJPEG和WebP相比,可以压缩出更小的文件。由于许可证问题,不太可能获得广泛的支持。浏览器支持:无。注意,有一个JS浏览器解码器**
  • HEIF (2015) - 用于存储HEVC编码的图像和图像序列的一种格式。苹果公司在 WWDC宣布,他们将在iOS上将JPEG转换为HEIF,从而节省了2倍的文件存储空间。浏览器支持:无,在文章创建时。现在Safari(Mac和iOS 11)可以支持。

如果你想更直观的了解,你可以欣赏一些上述格式的视觉比较工具,比如这里这里

综上所述可以看到,浏览器对图像格式的支持是很分散的。如果你希望利用上述任何一种格式,那么你就可能需要有条件地为每个目标浏览器提供不同的返回内容。在Google,我们已经看到了对WebP的一些支持,所以我们后面会做更深入的介绍。

您还可以使用.jpg扩展名(或任何其他扩展名)来表示一个图像格式(例如WebP,JPEG 2000),因为浏览器可以决定它渲染图像的媒体类型。这就允许服务器端使用请求中的Content-Type设置来决定要发送哪种格式的图像,而无需更改HTML中的内容。像Instart Logic这样的服务商在向他们的客户传送图像时,都是使用的这种方法。

接下来,让我们讨论另一种情况,当你无法有条件地提供不同的图像格式时使用的方法:使用JPEG优化编码器工具

下一篇:【译】重要的图像优化之四:“素人”JPEG下

最后编辑于
©著作权归作者所有,转载或内容合作请联系作者
  • 序言:七十年代末,一起剥皮案震惊了整个滨河市,随后出现的几起案子,更是在滨河造成了极大的恐慌,老刑警刘岩,带你破解...
    沈念sama阅读 159,117评论 4 362
  • 序言:滨河连续发生了三起死亡事件,死亡现场离奇诡异,居然都是意外死亡,警方通过查阅死者的电脑和手机,发现死者居然都...
    沈念sama阅读 67,328评论 1 293
  • 文/潘晓璐 我一进店门,熙熙楼的掌柜王于贵愁眉苦脸地迎上来,“玉大人,你说我怎么就摊上这事。” “怎么了?”我有些...
    开封第一讲书人阅读 108,839评论 0 243
  • 文/不坏的土叔 我叫张陵,是天一观的道长。 经常有香客问我,道长,这世上最难降的妖魔是什么? 我笑而不...
    开封第一讲书人阅读 44,007评论 0 206
  • 正文 为了忘掉前任,我火速办了婚礼,结果婚礼上,老公的妹妹穿的比我还像新娘。我一直安慰自己,他们只是感情好,可当我...
    茶点故事阅读 52,384评论 3 287
  • 文/花漫 我一把揭开白布。 她就那样静静地躺着,像睡着了一般。 火红的嫁衣衬着肌肤如雪。 梳的纹丝不乱的头发上,一...
    开封第一讲书人阅读 40,629评论 1 219
  • 那天,我揣着相机与录音,去河边找鬼。 笑死,一个胖子当着我的面吹牛,可吹牛的内容都是我干的。 我是一名探鬼主播,决...
    沈念sama阅读 31,880评论 2 313
  • 文/苍兰香墨 我猛地睁开眼,长吁一口气:“原来是场噩梦啊……” “哼!你这毒妇竟也来了?” 一声冷哼从身侧响起,我...
    开封第一讲书人阅读 30,593评论 0 198
  • 序言:老挝万荣一对情侣失踪,失踪者是张志新(化名)和其女友刘颖,没想到半个月后,有当地人在树林里发现了一具尸体,经...
    沈念sama阅读 34,313评论 1 243
  • 正文 独居荒郊野岭守林人离奇死亡,尸身上长有42处带血的脓包…… 初始之章·张勋 以下内容为张勋视角 年9月15日...
    茶点故事阅读 30,575评论 2 246
  • 正文 我和宋清朗相恋三年,在试婚纱的时候发现自己被绿了。 大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
    茶点故事阅读 32,066评论 1 260
  • 序言:一个原本活蹦乱跳的男人离奇死亡,死状恐怖,灵堂内的尸体忽然破棺而出,到底是诈尸还是另有隐情,我是刑警宁泽,带...
    沈念sama阅读 28,392评论 2 253
  • 正文 年R本政府宣布,位于F岛的核电站,受9级特大地震影响,放射性物质发生泄漏。R本人自食恶果不足惜,却给世界环境...
    茶点故事阅读 33,052评论 3 236
  • 文/蒙蒙 一、第九天 我趴在偏房一处隐蔽的房顶上张望。 院中可真热闹,春花似锦、人声如沸。这庄子的主人今日做“春日...
    开封第一讲书人阅读 26,082评论 0 8
  • 文/苍兰香墨 我抬头看了看天上的太阳。三九已至,却和暖如春,着一层夹袄步出监牢的瞬间,已是汗流浃背。 一阵脚步声响...
    开封第一讲书人阅读 26,844评论 0 195
  • 我被黑心中介骗来泰国打工, 没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留,地道东北人。 一个月前我还...
    沈念sama阅读 35,662评论 2 274
  • 正文 我出身青楼,却偏偏与公主长得像,于是被迫代替她去往敌国和亲。 传闻我的和亲对象是个残疾皇子,可洞房花烛夜当晚...
    茶点故事阅读 35,575评论 2 270

推荐阅读更多精彩内容