1127 chapter 10 stringr 下篇

工具

  • 确定与某种模式相匹配的字符串;
  • 找出匹配的位置;
  • 提取出匹配的内容;
  • 使用新值替换匹配内容;
  • 基于匹配拆分字符串。

匹配检测

  • str_view一个字符串只匹配一次,str_view_all匹配多次,但二者都不匹配重叠
  • str_detect()只返回是否符合的逻辑值,实际上计数更实
  • sum(str_detect(words, "^t"))
  • no_vowels_1 <- !str_detect(words, "[aeiou]")
  • str_count计数:每个字符串各匹配几次
  • str_subset提取匹配到的整个字符串
  • str_extrac以列表的形式返回每个字符串的匹配,只提取第一个匹配
  • str_extrac_all()提取所有匹配

分组匹配

  • str_replace 只替换每个字符串匹配到的第一个
  • str_replace_all替换每个字符串匹配到的所有
  • str_split()将字符串拆分为多个片段,返回列表,simplify = TRUE返回矩阵

其他类型的模式

regex()的参数

  • ignore_case = TRUE 忽略大小写
  • multiline = TRUE 分行,每行匹配一次(亲测)
  • comments = TRUE 可加注释
  • dotall = TRUE dotall = TRUE 可以使得. 匹配包括\n 在内的所有字符。

regex(),之外的3 种函数:

  • fixed() 按照字符串的字节形式进行精确匹配,不需要转义
  • coll() 使用标准排序规则来比较字符串
  • boundary() 边界6.正则表达式其他应用apropos() 函数可以在全局环境空间中搜索所有可用对象(可以搜函数)。
  • dir() 函数可以列出一个目录下的所有文件,pattern可用正则表达式匹配文件名

推荐阅读更多精彩内容