String源码阅读(一)

概述

       查阅String的源码时,首先需要阅读一下它的顶部注释,它里面说明了一些String在Java中的一些基本情况,了解它们有助于对后续源码的深入了解。这里我的java版本是10.0.2。

注释部分

下面大致描述一下String源码中的注释上到底说了那些内容:

String是Java中用于表示字符串的类,所有在Java程序中表示成形如:"abc"这种双引号括起来的形式都是String的实例。String是常量,一旦创建之后不可更改,但是可以通过其他的方式来创建可变的字符串,如:StringBuffer等。正因为String的不可变特性,所以它可以共享。另外:String str = "abc";它等价于

char[] data = {'a','b','c'}; 
String str = new String(data);

String类中提供了很多不同用处的方法,可以校验字符串中每一个字符,如:比较字符串,查找字符串,提取子串,拷贝字符串中的内容将其转换成大写或者小写的形式,这些操作都是基于Character类指定的Unicode标准版本。

String类中也提供了一些特殊的方法用于字符串连接,以及将其他类型转换成String类型,如果需要了解更多的关于字符串连接和类型转换的内容,可以查阅The Java Language Specification

在构造String对象的时候,如果构造函数中没有参数传入,在此对象上调用方法会导致NullPointerException异常。

Java中的字符串采用的是UTF-16的格式来展示的,多余的部分会通过一种叫做“surrogate pairs”来填充。这个概念在Unicode Representations中有介绍。补充字符在String中会占用两个字符位置。String中提供了一些方法来处理Unicode字符单元。

如果没有特别指明,String对象的比较不需要进行区域设置。在java.text.Collator类中提供了更细粒度的,基于区域敏感的字符串比较。

Java中字符串的连接操作取决于Java的编译器,编译器中可能使用StringBuffer、StringBuilder,甚至是StringConcatFactory来进行字符串的连接,它取决于JDK的版本。将其他类型转换成String可以通过toString方法,该方法是定义在Object类中的,所以Java中所有的类都继承了这个方法。

定义

首先看String类的定义:

public final class String
 implements java.io.Serializable, Comparable<String>, CharSequence

       首先它实现了Serializable接口,说明String的对象是可以进行传输和持久化的。这个很好理解,毕竟现在很多的远端调用,数据传输之类的操作,字符串在其中起到了很大的作用。

       它实现了Comparable接口,说明String对象是可比的,该接口中就定义了一个compareTo方法,后面会说道String中重写的这个compareTo。说道Comparable,这里就稍微提一下Comparator,它是Java中的一个比较器,在Java中如果类本身是具有可比较的,可以实现Comparable接口并重写比较方法即可,但是有些情况下,可能类中没有实现该接口,但是在一些特殊业务场景下它们之间需要进行比较,就可以自己写一个比较器实现此接口,将需要比较的类型传入进去,手动实现内部的比较逻辑。

       最后它实现了CharSequence接口,这个接口其实就是就是一个规范约定,这个接口本身就是表示一种可读的字符序列值,对于不同的字符序列,它提供了一个统一且只读的方式来处理。但是它本身不会细化关于equals和hashCode方法的处理,因此不同的类可以有不同的equals和hashCode方法实现,所以将任意的CharSequence实例用作集合中的元素映射或map中的key是不合适的,因为很明显它无法保证唯一性。

       另外:该类是用final修饰,所以无法继承,其实不仅String类如此,Java中的八种基本类型对应的包装类都是final修饰,都无法继承。

字段介绍

value

@Stable
private final byte[] value;

       这个一个byte数组,字符串的值都存储在这个数组中,这个该字段可以看到是final修饰,所以一旦赋值之后不可改变,这也印证了上面说的String是不可变的这一观点。

       另外这里使用了Stable注解,这个注解只有用在被根加载器加载的类中才有作用,否则加载器会忽略它。它用在这里的目的表示当前value中的值是可信任的,Stable用在这里很安全,因为value的值不会为null。这里看一个例子:

String str = new String();
Field field = str.getClass().getDeclaredField("value");
field.setAccessible(true);
System.out.println(field.get(str)); // 结果为:[B@4157f54e

       这里我声明了一个空字符串,通过反射,拿到此时的value的值,但是从结果可以看到,value不是null。

coder和hash

private final byte coder;
private int hash;

       该字段用于区分value中内容的编码格式,它受虚拟机信任, 如果在构造对象之后重写该字段的内容会导致错误。后面介绍一些String方法的时候会使用到它,不同的编码方式,解析和比较都会有不同。

       hash默认是0,它用于存储String对象对应的hashCode值。

serialVersionUID

private static final long serialVersionUID = -6849794470754667710L;

       这个就是序列号,用于序列化和反序列化的操作标识,不用多说,这里的值使用的是从JDK1.0.2版本中的序列号值,很明显就是为了和之前版本的String对象反序列化的时候能够兼容。

COMPACT_STRINGS

static final boolean COMPACT_STRINGS;
static {
 COMPACT_STRINGS = true;
}

       可以看到它在类加载的时候就默认赋值为true了,这个字段的字面意思就是压缩字符串,其实它的作用主要体现在编译器的优化上面,如果该字段设置为false,那么value中内容就永远使用UTF-16编码,在有些情况下对于JIT编译器的的执行有一定的优化作用,这里源码的注释中提供了一个示例:

//有代码如下
if (coder == LATIN1) { ... }
//它可以被改写成如下方式:
if (COMPACT_STRINGS && coder == LATIN1) { ... }
//JIT优化的时候,就可以将上面的代码进行压缩处理,等价于:
//如果COMPACT_STRINGS == true 可以优化成
if (coder == LATIN1) { ... }
//如果COMPACT_STRINGS == false
if (false) { ... }

serialPersistentFields

该字段主要是跟序列化的协议有关,这里暂时就不做深入考虑。后面的讨论中更多的会以value字段来讨论,其他字段不在讨论范围,在某些特殊情况下可能会用到,真正使用到的时候再讨论。

©著作权归作者所有,转载或内容合作请联系作者
  • 序言:七十年代末,一起剥皮案震惊了整个滨河市,随后出现的几起案子,更是在滨河造成了极大的恐慌,老刑警刘岩,带你破解...
    沈念sama阅读 160,026评论 4 364
  • 序言:滨河连续发生了三起死亡事件,死亡现场离奇诡异,居然都是意外死亡,警方通过查阅死者的电脑和手机,发现死者居然都...
    沈念sama阅读 67,655评论 1 296
  • 文/潘晓璐 我一进店门,熙熙楼的掌柜王于贵愁眉苦脸地迎上来,“玉大人,你说我怎么就摊上这事。” “怎么了?”我有些...
    开封第一讲书人阅读 109,726评论 0 244
  • 文/不坏的土叔 我叫张陵,是天一观的道长。 经常有香客问我,道长,这世上最难降的妖魔是什么? 我笑而不...
    开封第一讲书人阅读 44,204评论 0 213
  • 正文 为了忘掉前任,我火速办了婚礼,结果婚礼上,老公的妹妹穿的比我还像新娘。我一直安慰自己,他们只是感情好,可当我...
    茶点故事阅读 52,558评论 3 287
  • 文/花漫 我一把揭开白布。 她就那样静静地躺着,像睡着了一般。 火红的嫁衣衬着肌肤如雪。 梳的纹丝不乱的头发上,一...
    开封第一讲书人阅读 40,731评论 1 222
  • 那天,我揣着相机与录音,去河边找鬼。 笑死,一个胖子当着我的面吹牛,可吹牛的内容都是我干的。 我是一名探鬼主播,决...
    沈念sama阅读 31,944评论 2 314
  • 文/苍兰香墨 我猛地睁开眼,长吁一口气:“原来是场噩梦啊……” “哼!你这毒妇竟也来了?” 一声冷哼从身侧响起,我...
    开封第一讲书人阅读 30,698评论 0 203
  • 序言:老挝万荣一对情侣失踪,失踪者是张志新(化名)和其女友刘颖,没想到半个月后,有当地人在树林里发现了一具尸体,经...
    沈念sama阅读 34,438评论 1 246
  • 正文 独居荒郊野岭守林人离奇死亡,尸身上长有42处带血的脓包…… 初始之章·张勋 以下内容为张勋视角 年9月15日...
    茶点故事阅读 30,633评论 2 247
  • 正文 我和宋清朗相恋三年,在试婚纱的时候发现自己被绿了。 大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
    茶点故事阅读 32,125评论 1 260
  • 序言:一个原本活蹦乱跳的男人离奇死亡,死状恐怖,灵堂内的尸体忽然破棺而出,到底是诈尸还是另有隐情,我是刑警宁泽,带...
    沈念sama阅读 28,444评论 3 255
  • 正文 年R本政府宣布,位于F岛的核电站,受9级特大地震影响,放射性物质发生泄漏。R本人自食恶果不足惜,却给世界环境...
    茶点故事阅读 33,137评论 3 238
  • 文/蒙蒙 一、第九天 我趴在偏房一处隐蔽的房顶上张望。 院中可真热闹,春花似锦、人声如沸。这庄子的主人今日做“春日...
    开封第一讲书人阅读 26,103评论 0 8
  • 文/苍兰香墨 我抬头看了看天上的太阳。三九已至,却和暖如春,着一层夹袄步出监牢的瞬间,已是汗流浃背。 一阵脚步声响...
    开封第一讲书人阅读 26,888评论 0 197
  • 我被黑心中介骗来泰国打工, 没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留,地道东北人。 一个月前我还...
    沈念sama阅读 35,772评论 2 276
  • 正文 我出身青楼,却偏偏与公主长得像,于是被迫代替她去往敌国和亲。 传闻我的和亲对象是个残疾皇子,可洞房花烛夜当晚...
    茶点故事阅读 35,669评论 2 271

推荐阅读更多精彩内容

  • Spring Cloud为开发人员提供了快速构建分布式系统中一些常见模式的工具(例如配置管理,服务发现,断路器,智...
    卡卡罗2017阅读 134,103评论 18 139
  • 1. Java基础部分 基础部分的顺序:基本语法,类相关的语法,内部类的语法,继承相关的语法,异常的语法,线程的语...
    子非鱼_t_阅读 31,296评论 18 399
  • 临诗江,是几大南方水系中珠江水系的一条,属于西江的上游,水面宽处不过一百多米,长不过三百多千米,发源于富川县麦岭镇...
    斜杠秀才阅读 520评论 0 0
  • 樱桃是所有水果中我最喜爱的水果,也许是因为上市的时间短的缘故,对她情有独钟。白色的樱桃花还挂在枝头上,我就开始...
    莲子清清阅读 456评论 4 2
  • 2017年11月21日晴 今天晚上回到家,买的榴莲我跟闺女最爱吃,吃饭前闺女吃啦一块,吃完饭还想吃爸爸不让吃啦,说...
    耿钰茜妈妈阅读 144评论 0 0