Base64编码

字数 801阅读 238

Base64编码

Base64编码是一种基于64个字符的编码,按照RFC2045的定义,Base64被定义为:Base64内容传送编码被设计用来把任意序列的8位字节描述为一种不易被人直接识别的形式。完整的Base64定义可见RFC 1421和RFC 2045。编码后的数据比原始数据略长,为原来的¾,编码中往往会以“=”号来结尾,这是因为其编码表的第64位是用“=”来补位的原因。严格的来讲Base64并不能算是加密算法,主要原因是因为其编码表是公开的,但是如果自己自定义一个编码表并不将其对外公开,也是可以起到加密的作用的。对于不同的编码,生成的密文会出现不一致的情况。

实现原理

Base64算法主要是对给定的字符以与字符编码(如ASCII字符,UTF-8码)对应的十进制数为基准,做编码操作:

1、将给定的字符串以字符为单位转换为对应的字符编码(如ASCII码)。
2、将获得的字符编码转换为二进制码。
3、对获得的二进制码做分组转换操作,每3个8位二进制码为一组,转换为每4个6位二进制码为一组(不足6位时低位补0)。这是一个分组变化的过程,3个8位二进制码和4个6位二进制码的长度都是24位(38=46)。
4、对获得的4个6位二进制码补位,向6位二进制码添加2位高位0,组成4个8位二进制码。
5、将获得的4个8位二进制转换为十进制码。
6、将获得的十进制码转换为Base64字符表中对应的字符。

Base64实现

Bouncy Castle、Common Codec和Sun都提供了Base64的实现,其中Sun的实现是不被推荐使用的,首先他的实现并不开源,而且使用的时候会警告可能会在将来的版本中删除。Bouncy Castle和Common Codec其实现方式最大的区别就是Common Codec提供了RFC2045标准的Base64实现,每76个字符加一个换行符,如果当前行不足76个字符,也要加换行符。

URLBase64

Base64编码可用于在HTTP环境下传递较长的标识信息,Bouncy Castle和Common Codec同样也提供了实现。相对于其对Base64的实现有略微的差异,URL的参数中是不允许出现“=”的,所以采用新的符号作为补位,其中Bouncy Castle是采用“.”作为填充的,而Common Code的URLBase64实现直接舍弃掉了补位符!也就是说他的URLBase64实现编码是不定长的。

参考:
1、维基百科:https://zh.wikipedia.org/wiki/Base64
2、《JAVA加密与解密的艺术》

推荐阅读更多精彩内容