Java正则表达式Pattern与Matcher类

Pattern.split方法详解

/**
     * 测试Pattern.split方法
     */
    @Test
    public void testPatternSplit() {

        String str = "{0x40, 0x11, 0x00, 0x00}";
        // 分割符为:逗号, {,}, 空白符
        String regex = "[,\\{\\}\\s]";
        Pattern pattern = Pattern.compile(regex);

        /*
        * 1. split 方法用于使用正则表达式中的字符分割待匹配的字符串
        *
        * 注意:
        *    1. 如果分割符位于原字符串的起始位置,则分割的时候,会在起始位置上分割出一个""出来
        *    2. 如果有连续两个分隔符,则会在这两个分割符之间分割有一个""出来
        * */
        System.out.println("----------- split test -----------");
        String[] results = pattern.split(str);

        System.out.println("length :" + results.length);
        for (int i = 0; i < results.length; i++) {
            System.out.println("element_" +i + " :" +  results[i]);
        }

        System.out.println(Arrays.toString(results));

        /*
        * 2. split方法的limit参数的意思是使用正则表达式的分割字符将原字符串分为limit个组
        * **/
        System.out.println("\n----------- split limit test -----------");
        String[] resultsLimit = pattern.split(str, 2);
        for (int i = 0; i < resultsLimit.length; i++) {
            System.out.print(resultsLimit[i]);
        }
    }

结果:

----------- split test -----------
element_0 :
element_1 :0x40
element_2 :
element_3 :0x11
element_4 :
element_5 :0x00
element_6 :
element_7 :0x00
[, 0x40, , 0x11, , 0x00, , 0x00]

----------- split limit test -----------
0x40, 0x11, 0x00, 0x00}

Matcher的find/find/start/end方法详解

  1. 测试Matcher的find方法:尝试在目标字符串中查找下一个匹配的字串,需在循环中迭代。
  2. groupCount :返回当前查找所获得的匹配组的数量,不包括整个整个正则表达式的匹配。
    比如,表达式有两个子分组,则groupCount == 2
  3. group(i):指的是用()包含的子分组,按照定义的顺序标识下标,当正则表达式中使用 |连接分组,那么有的分组匹配的字串可能为null。
  4. start(group):返回此子分组匹配的子串在原字符串中的起始位置(包含)
    end(group):返回此子分组匹配的子串在原字符串中的结束位置(不包含)
    即子分组匹配的字符串在原字符串的位置为 [start(i),end(i)),左闭右开。
 @Test
    public void testMatcherGroupFindStartEnd() {
        String str = "{0x40, 0x31, 0x20, 0x00}";
        String regex = "([A-Za-z0-9]+)(,)";
        Pattern pattern = Pattern.compile(regex);

        Matcher matcher = pattern.matcher(str);

        // 对于在整个原字符串中,找到的下一个匹配的字串
        while (matcher.find()) {
            // 输出groupCount的数量
            System.out.println("groupCount : " + matcher.groupCount());

            // 0-输出整个匹配
            System.out.println("the substring of contains all group : " + matcher.group(0));
            System.out.println("group_0 start index : " + matcher.start(0) + " end :" + matcher.end(0));

            // 依次输出子分组的匹配结果
            // 如果子分组之间是通过 | 来连接的,则子分组的匹配结果有的为null
            for (int i = 1; i <= matcher.groupCount(); i++) {
                System.out.println("group_" + i + ":" + matcher.group(i));
                System.out.println("group_" + i + " start index : " + matcher.start(i) + " end :" + matcher.end(i));
            }
        }
    }

结果:

groupCount : 2
the substring of contains all group : 0x40,
group_0 start index : 1 end :6
group_1:0x40
group_1 start index : 1 end :5
group_2:,
group_2 start index : 5 end :6
groupCount : 2
the substring of contains all group : 0x31,
group_0 start index : 7 end :12
group_1:0x31
group_1 start index : 7 end :11
group_2:,
group_2 start index : 11 end :12
groupCount : 2
the substring of contains all group : 0x20,
group_0 start index : 13 end :18
group_1:0x20
group_1 start index : 13 end :17
group_2:,
group_2 start index : 17 end :18

Matcher的replace/append方法详解

测试Matcher的匹配替换以及追加的方法:

  1. matcher.replaceAll方法 :替换在原字符串中所有被正则表达式匹配的字串,并返回替换之后的结果
  2. matcher.replaceFirst方法 :替换在原字符串中第一个被正则表达式匹配的字串,并返回替换之后的结果
  3. matcher.appendReplacement方法 : 将当前匹配子串替换为指定字符串,并且将替换后的子串以及其之前到上次匹配子串之后的字符串段添加到一个StringBuffer对象里(需while(matcher.find())进行配合迭代)
  4. matcher.appendTail(StringBuffer sb) 方法则将最后一次匹配工作后剩余的字符串添加到一个StringBuffer对象里。

3和4的结合能够实现将原字符串中的某些字串替换指定字符,并返回完成替换之后的结果

@Test
    public void testMatcherReplaceAppend() {
        String str = "{0x40, 0x31, 0x20, 0x00}";
        String regex = "([0-9A-Za-z]+)";
        Pattern pattern = Pattern.compile(regex);

        Matcher matcher = pattern.matcher(str);

        // replaceAll
        System.out.println("----------- replace all test ----------");
        String replacedAllStr = matcher.replaceAll("replace");
        System.out.println("replaced : " + replacedAllStr);
        //matcher.reset(str); // 重置被matcher的字符串
        matcher.reset(); // 重置matcher,以实现对原字符串重新搜索

        // replaceFirst
        System.out.println("------------ replace first test ---------");
        String replacedFirstStr = matcher.replaceFirst("replace");
        System.out.println("replaced first : " + replacedFirstStr);
        matcher.reset();

        // appendReplacement
        System.out.println("------------- appendReplacement test ------------");
        StringBuffer appendRepStr = new StringBuffer();
        while (matcher.find()) {
            matcher.appendReplacement(appendRepStr,"0xffff");
        }
        System.out.println(appendRepStr);

        // 最后调用appendTail将匹配剩余的字符串添加都StringBuffer的末尾
        // 注意这时要实现完整的功能:将所有匹配的内容替换并添加到appendRepStr中,剩余未匹配的继续添加到
        // appendRepStr中,相当于对原字符串进行全部的替换
        // 此时要保证,在遍历所有匹配的字串后调用appendTail方法

        System.out.println("------------ appendTail test ---------------");
        matcher.appendTail(appendRepStr);

        System.out.println(appendRepStr);
    }

结果:

----------- replace all test ----------
replaced : {replace, replace, replace, replace}
------------ replace first test ---------
replaced first : {replace, 0x31, 0x20, 0x00}
------------- appendReplacement test ------------
{0xffff, 0xffff, 0xffff, 0xffff
------------ appendTail test ---------------
{0xffff, 0xffff, 0xffff, 0xffff}

测试文件源码地址
https://github.com/zhanglbjames/exercises/blob/master/src/test/java/huawei_8_16/TestT1.java

1-匹配字符类

方括号一次只能匹配括号内的一个字符
  • [abc]

a, b, or c (简单类)

  • [^abc]

除了a、b或c之外的任意 字符(求反)

  • [a-zA-Z]

a到z或A到Z ,包含(范围)

  • [a-zA-Z0-9]

匹配一次所有数字和字母的类型

  • [a-b-r]

匹配 a-b ,连接符 -,r
注意如果想要连接符起到范围的作用,应该满足如下格式[a-bc-de-gf-k]
即每个连接符占用的字符不能被其他连接符占用

圆括号一次匹配多个字符
  1. 比如方括号的正则表达式"t[aeio]n"只匹配"tan"、"Ten"、"tin"和"ton",只能匹配单个字符,不能匹配"taeion"
  2. 圆括号可以一次匹配多个字符,比如使用"t(a|e|i|o|oo)n"正则表达式,可以匹配"taen","tan","taeiooon"等
    也可以配合[]使用,如正则为"t([aei]|o|oo)n",则可以匹配 "taon","teoon",但是不能匹配"taeioon"

2-预定义字符类

  • . 匹配除换行符 \n 之外的任何单字符

比如:表达式就是“t.n”,它匹配“tan”、“ten”、“tin”和“ton”,还匹配“t#n”、“tpn”甚至“t n”。

  • \d 数字: [0-9]
  • \D 非数字: [^0-9]
  • \s 空格符: [ \t\n\x0B\f\r]
  • \S 非空格符: [^\s]
  • \w 单词字符: [a-zA-Z_0-9]
  • \W 非单词字符: [^\w]

记忆规则 大写表示取反,小写如下记忆

d:digit(数字)
s:space(空白字符)
w:word(单词字符), 注意包括下划线

3-表达式匹配次数

* 0次或者多次(允许0次的贪婪匹配)

例如,zo* 能匹配 "z" 以及 "zoo"。* 等价于{0,}

+ 1次或者多次(贪婪匹配)

例如,'zo+' 能匹配 "zo" 以及 "zoo",但不能匹配 "z"。+ 等价于 {1,}。

? 0次或者1次 (非贪婪匹配,允许0次)

例如,"do(es)?" 可以匹配 "do" 或 "does" 。? 等价于 {0,1}。

{n} 恰好n次
{n,m} 从n次到m次
{n,} 至少n次

注意上述n为非负数

4-特殊字符需要转义

特殊字符
最后编辑于
©著作权归作者所有,转载或内容合作请联系作者
  • 序言:七十年代末,一起剥皮案震惊了整个滨河市,随后出现的几起案子,更是在滨河造成了极大的恐慌,老刑警刘岩,带你破解...
    沈念sama阅读 159,458评论 4 363
  • 序言:滨河连续发生了三起死亡事件,死亡现场离奇诡异,居然都是意外死亡,警方通过查阅死者的电脑和手机,发现死者居然都...
    沈念sama阅读 67,454评论 1 294
  • 文/潘晓璐 我一进店门,熙熙楼的掌柜王于贵愁眉苦脸地迎上来,“玉大人,你说我怎么就摊上这事。” “怎么了?”我有些...
    开封第一讲书人阅读 109,171评论 0 243
  • 文/不坏的土叔 我叫张陵,是天一观的道长。 经常有香客问我,道长,这世上最难降的妖魔是什么? 我笑而不...
    开封第一讲书人阅读 44,062评论 0 207
  • 正文 为了忘掉前任,我火速办了婚礼,结果婚礼上,老公的妹妹穿的比我还像新娘。我一直安慰自己,他们只是感情好,可当我...
    茶点故事阅读 52,440评论 3 287
  • 文/花漫 我一把揭开白布。 她就那样静静地躺着,像睡着了一般。 火红的嫁衣衬着肌肤如雪。 梳的纹丝不乱的头发上,一...
    开封第一讲书人阅读 40,661评论 1 219
  • 那天,我揣着相机与录音,去河边找鬼。 笑死,一个胖子当着我的面吹牛,可吹牛的内容都是我干的。 我是一名探鬼主播,决...
    沈念sama阅读 31,906评论 2 313
  • 文/苍兰香墨 我猛地睁开眼,长吁一口气:“原来是场噩梦啊……” “哼!你这毒妇竟也来了?” 一声冷哼从身侧响起,我...
    开封第一讲书人阅读 30,609评论 0 200
  • 序言:老挝万荣一对情侣失踪,失踪者是张志新(化名)和其女友刘颖,没想到半个月后,有当地人在树林里发现了一具尸体,经...
    沈念sama阅读 34,379评论 1 246
  • 正文 独居荒郊野岭守林人离奇死亡,尸身上长有42处带血的脓包…… 初始之章·张勋 以下内容为张勋视角 年9月15日...
    茶点故事阅读 30,600评论 2 246
  • 正文 我和宋清朗相恋三年,在试婚纱的时候发现自己被绿了。 大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
    茶点故事阅读 32,085评论 1 261
  • 序言:一个原本活蹦乱跳的男人离奇死亡,死状恐怖,灵堂内的尸体忽然破棺而出,到底是诈尸还是另有隐情,我是刑警宁泽,带...
    沈念sama阅读 28,409评论 2 254
  • 正文 年R本政府宣布,位于F岛的核电站,受9级特大地震影响,放射性物质发生泄漏。R本人自食恶果不足惜,却给世界环境...
    茶点故事阅读 33,072评论 3 237
  • 文/蒙蒙 一、第九天 我趴在偏房一处隐蔽的房顶上张望。 院中可真热闹,春花似锦、人声如沸。这庄子的主人今日做“春日...
    开封第一讲书人阅读 26,088评论 0 8
  • 文/苍兰香墨 我抬头看了看天上的太阳。三九已至,却和暖如春,着一层夹袄步出监牢的瞬间,已是汗流浃背。 一阵脚步声响...
    开封第一讲书人阅读 26,860评论 0 195
  • 我被黑心中介骗来泰国打工, 没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留,地道东北人。 一个月前我还...
    沈念sama阅读 35,704评论 2 276
  • 正文 我出身青楼,却偏偏与公主长得像,于是被迫代替她去往敌国和亲。 传闻我的和亲对象是个残疾皇子,可洞房花烛夜当晚...
    茶点故事阅读 35,608评论 2 270

推荐阅读更多精彩内容