Java Charset和字符串

  1. Java里面的String类型,在内存中,没有io之前,都是unicode。
  2. Charset常见的几个ISO-8859-1, GBK, UTF-8,都是把unicode按照特定的规范转换成字符。其中utf-8涵盖unicode最广泛

常见的例子:

  1. 一个文件以utf-8的charset存储,你用gbk读取了,怎么还原文件的内容
    将读取的char[](String this.value)按照GBK encode后写出来,再按照UTF-8 decode后写回到char[](String this.value)
  String errStr = "gbkCharSetStr";
  new String(errStr.getBytes("GBK"),"UTF-8");
  1. 一个以gbk存储的文件,怎么样保存为utf-8的charset文件
  InputStreamReader isr = new InputStreamReader(new FileInputStream(gbkFileName),"GBK");
  OutputStreamWriter osw = new OutputStreamWriter(new FileOutputStream(utf8FileName),"UTF-8");

推荐阅读更多精彩内容

  • 编码问题一直困扰着开发人员,尤其在 Java 中更加明显,因为 Java 是跨平台语言,不同平台之间编码之间的切换...
    x360阅读 2,177评论 1 20
  • 1. Java基础部分 基础部分的顺序:基本语法,类相关的语法,内部类的语法,继承相关的语法,异常的语法,线程的语...
    子非鱼_t_阅读 30,631评论 18 399
  • Spring Cloud为开发人员提供了快速构建分布式系统中一些常见模式的工具(例如配置管理,服务发现,断路器,智...
    卡卡罗2017阅读 131,794评论 18 138
  • 字符集和编码简介 在编程中常常可以见到各种字符集和编码,包括ASCII,MBCS,Unicode等字符集。确切的说...
    兰山小亭阅读 7,075评论 0 13
  • 清澈晨露/ 冉冉朝阳/ 雏鸟展翅/ 跃跃欲翔/ 一群少年/ 荣幸东方/ 浓眉大眼/ 可爱鼻梁/ 面...
    让爱照亮天空阅读 333评论 1 1
  • 写完这个标题,我愣了一下:昔日斯文的我怎么爆粗口了?发泄发泄吧…… 元月份,我怀孕了。孕早期反应特别厉害,我多么希...
    千金女阅读 306评论 5 2
  • 社交“绑架”本质上是人云亦云。有许多原因导致,比如不知道什么重要或者什么更重要、在意别人对自己的看法,还有不自信。...
    呱呱哇阅读 172评论 0 1
  • 2017.10.19星期四 阴 农历八月三十 昨天晚上老公破天荒带我去了七宝老街,上海每年都来,可是老公从来没有说...
    小幸福vs茹萍阅读 136评论 2 1