String、byte[]、Base64相互转换,不要再用错了

String与byte[]

在Java项目开发过程中,时常会遇到String与byte[]互相转换的过程,比如IO流处理,需要先将文件或字符串转为字节流,接收方需要将字节流转回字符串。那么,在相互转换的过程中,有哪些坑需要注意呢?

直接看代码
@Test
public void testStringAndByteArray() {

    String s1 = "hello world";
    byte[] bytes1 = s1.getBytes();

    // 实际调用 bytes1.toString()
    System.out.println(bytes1);

    // 同样调用 bytes1.toString()
    System.out.println(String.valueOf(bytes1));

    // Constructs a new String by decoding the specified array of bytes
    // 通过方法注释可以看到,该方法是使用字节数组构造一个新的字符串
    String s2 = new String(bytes1);
    System.out.println(s2);
    System.out.println("s1与s2是否为同一个对象:" + (s1 == s2));

    // 指定编码
    byte[] bytes2 = s1.getBytes(StandardCharsets.UTF_8);
    System.out.println(new String(bytes2, StandardCharsets.UTF_8));
}
运行结果如下:
[B@2f08c4b
[B@2f08c4b
hello world
s1与s2是否为同一个对象:false
hello world

Base64

Base64是网络上最常见的用于传输8Bit字节码的编码方式之一,Base64就是一种基于64个可打印字符来表示二进制数据的方法。 ——百度百科

在实际项目开发过程中,遇见不少同学对Base64理解有误,有些小伙伴甚至将其用来对敏感数据加密。从上述概念字面描述可以看到,Base64就是一种编码方式,跟加密解密无关系。计算机中任何数据都是按ascii码存储的,而ascii码的128~255之间的值是不可见字符,通过Base64编码可以将字节码编码为可见和便于传输的字符串,通常在处理文本数据的场合,表示、传输、存储一些二进制数据会用到Base64编码。

示例代码如下:
@Test
public void testStringAndBase64() {

    String s1 = "hello world";

    byte[] bytes1 = s1.getBytes();
    System.out.println("1. byte1数组的内存地址:" + bytes1);

    s1 = new String(bytes1);
    System.out.println("2. 通过new String()将bytes1转回字符串:" + s1);

    String s2 = Base64.encodeBase64String(bytes1);
    System.out.println("3. 将byte1数组转为Base64编码字符串:" + s2);

    byte[] bytes2 = Base64.encodeBase64(bytes1);
    String s3 = new String(bytes2);
    System.out.println("4. 通过new String()将bytes2转回字符串:" + s3);

    // Base64.encodeBase64String(bytes1) 相当于 new String(Base64.encodeBase64(bytes1))
    Assert.assertEquals(s2, s3);

    byte[] bytes3 = Base64.decodeBase64(s3);
    System.out.println("5. 将Base64字符串解码回字节数组bytes3:" + bytes3);
    System.out.println("6. 通过new String()将bytes3转回字符串:" + new String(bytes3));
}

==注:以上代码使用org.apache.commons.codec.binary.Base64==

运行结果如下:
1. byte1数组的内存地址:[B@372ea2bc
2. 通过new String()将bytes1转回字符串:hello world
3. 将byte1数组转为Base64编码字符串:aGVsbG8gd29ybGQ=
4. 通过new String()将bytes2转回字符串:aGVsbG8gd29ybGQ=
5. 将Base64字符串解码回字节数组bytes3:[B@114a85c2
6. 通过new String()将bytes3转回字符串:hello world

推荐阅读更多精彩内容