Base64详解

** Base64用于将二进制数据编码成ASCII字符 ** (图片、文件等都可转化为二进制数据)
传输信道只支持ASCII字符,不方便传输二进制流的场合。
含有非ASCII字符,容易出现编码问题的场合。(中文字符)

Base64编码说明

Base64编码要求把3个8位字节(3X8=24)转化为4个6位的字节(4X6=24),之后在6位的前面补两个0,形成8位一个字节的形式。 如果剩下的字符不足3个字节,则用0填充,输出字符使用'=',因此编码后输出的文本末尾可能会出现1或2个'='。

为了保证所输出的编码位可读字符,Base64制定了一个编码表,以便进行统一转换。编码表的大小为2^6=64,这也是Base64名称的由来。

Base64.png

Base64要求把每三个8Bit的字节转换为四个6Bit的字节(3 X 8 = 4 X 6 = 24),然后把6Bit再添两位高位0,组成四个8Bit的字节,也就是说,转换后的字符串理论上将要比原来的长1/3。

** 举例 **

下面是一个简单的base64编码实例。在这里,三个字符组成的输入值“Ow!”是base64编码的,得到的是4个字符的base64编码值“T3ch”。它是按以下方式工作的。

  • (1) 字符串"zrf"被拆分成3个8位的字节(0x7A、0x72、0x66)。
  • (2) 这3个字节构成了一个24为的二进制01111010 01110010 01100110。
  • (3) 这些为被划分为一些6位的序列011110、100111、0010 01、100110。
  • (4) 每个6位值都表示了从0~63之间的数字,“ 30,39,9,38 ”对应base64字母表中的64个字符之一。
    得到的base64编码字符串是4个字符的字符串“enJm”。

然后就可以通过线路将这个字符串作为“安全的”8位字符传送出去,因为只用了一些移植性最好的字符(字母、数字等)。

原文的字节数量应该是3的倍数啊,如果这个条件不能满足的话,那该怎么办呢?

我们的解决办法是这样的:原文的字节不够的地方可以用全0来补足,转换时Base64编码用=号来代替。这就是为什么有些Base64编码会以一个或两个等号结束的原因,但等号最多只有两个。因为:

** 余数 = 原文字节数 MOD 3 **

所以余数任何情况下都只可能是0,1,2这三个数中的一个。如果余数是0的话,就表示原文字节数正好是3的倍数(最理想的情况啦)。如果是1的话,为了让Base64编码是3的倍数,就要补2个等号;同理,如果是2的话,就要补1个等号。

各种下载软件地址

先以“迅雷下载”为例: 很多下载类网站都提供“迅雷下载”的链接,其地址通常是加密的迅雷专用下载地址。

thunder://QUFodHRwOi8vd3d3LmJhaWR1LmNvbS9pbWcvc3NsbTFfbG9nby5naWZaWg==

其实迅雷的“专用地址”也是用Base64加密的,其加密过程如下:

** ps:**

标准的Base64并不适合直接放在URL里传输,因为URL编码器会把标准Base64中的“/”和“+”字符变为形如“%XX”的形式,而这些“%”号在存入数据库时还需要再进行转换,因为ANSI SQL中已将“%”号用作通配符。

为解决此问题,可采用一种用于URL的改进Base64编码,它不在末尾填充'='号,并将标 准Base64中的“+”和“/”分别改成了“*”和“-”,这样就免去了在URL编解码和数据库存储时所要作的转换,避免了编码信息长度在此过程中的增 加,并统一了数据库、表单等处对象标识符的格式。

另有一种用于正则表达式的改进Base64变种,它将“+”和“/”改成了“!”和“-”,因为“+”,“*”以及前面在IRCu中用到的“[”和“]”在正则表达式中都可能具有特殊含义。

此外还有一些变种,它们将“+/”改为“-”或“.”(用作编程语言中的标识符名称)或“.-”(用于XML中的Nmtoken)甚至“_:”(用于XML中的Name)。

推荐阅读更多精彩内容

  • 可以看我的博客 lmwen.top 或者订阅我的公众号 简介有稍微接触python的人就会知道,python中...
    ayuLiao阅读 1,699评论 1 5
  • 原文在这里:各种字符集和编码详解 在软件的编码和实现中,我们可能会碰到个 一个比较头疼的问题--编码,不同字符间的...
    舌尖上的大胖阅读 1,057评论 0 2
  • 凌晨的高架桥 誰在铁轨旁走着誰让我跟着 路灯散发的光芒强于月光 树林有它巨大的影子 火车从桥上开过 迎接那深不可测...
    雲归阅读 37评论 0 0
  • 十一假期结束,昨天下午返程。路上堵,车上挤,偏逢连阴雨。拎着沉甸甸的行李,心中一万只草泥马奔腾而过,假期里的逍遥快...
    桔燃阅读 322评论 0 0
  • 1.有序列表、无序列表、自定义列表如何使用?写个简单的例子。三者在语义上有什么区别?在哪些情况下使用哪种(重要)?...
    墨月千楼阅读 88评论 0 0