正则表达式

1. 元字符
import re

a = 'dfsdfpy111thondf123123123dfd'

ret = re.findall('\D',a)

# \d 匹配数字 \D 匹配非数字
print(ret)
2. 字符集
import re

a = 'abc, acc, adc, aec, afc, ahc'

ret = re.findall('a[cf]c',a)       # ['acc', 'afc']
ret1 = re.findall('a[^cf]c',a)     # ['abc', 'adc', 'aec', 'ahc'] ^会去反
ret2 = re.findall('a[c-f]c',a)     # ['acc', 'adc', 'aec', 'afc']

print(ret2)  
3. 概况字符集
# \w 单词字符 \W
# \s 空白字符 \S
import re

a = 'abc\n4\s342 fdf\ra\tahc'

ret = re.findall('\s',a)           # ['\n', ' ', '\r', '\t']
ret1 = re.findall('\W',a)          # ['\n', '\\', ' ', '\r', '\t']
ret2 = re.findall('\w',a)          # ['a', 'b', 'c', '4', 's', '3', '4', '2', 'f', 'd', 'f', 'a', 'a', 'h', 'c']
print(ret2)
4. 数量词
import re

a = 'python php java'
ret = re.findall('[a-z]{3,6}',a)       # ['python', 'php', 'java']

print(ret)
5. 贪婪模式
import re

a = 'pythonq12334 php24111444java'
# 默认是贪婪模式,会匹配更多的字符,也就是 6
# 非贪婪模式后面加 ? 会尽肯能少的匹配
ret = re.findall('[a-z]{3,6}',a)    # ['python', 'php', 'java']
ret1 = re.findall('[a-z]{3,6}?',a)  # ['pyt', 'hon', 'php', 'jav']

print(ret)
6. 匹配0次1次或者无限多次
import re
# * 匹配0次或者更多次
#  + 匹配一次或者更多次
# ? 匹配0次或者一次
# 这里匹配的是n  !
a = 'ipytho12334 python24111pythonn444java'
ret1 = re.findall('python*',a)               # ['pytho', 'python', 'pythonn']
ret2 = re.findall('python+',a)              # ['python', 'pythonn']
ret3 = re.findall('python?',a)              # ['pytho', 'python', 'python']
ret4 = re.findall('python{1,2}',a)          # ['python', 'pythonn']
ret5 = re.findall('python{1,2}?',a)          # ['python', 'python']

print(ret4)
7. 边界
import re

a = '1000001'           # len=7

ret = re.findall('\d{4,6}',a)              # ['100000']
ret1 = re.findall('^\d{4,7}$',a)           # ['1000001']
ret2 = re.findall('000',a)                 # [000]
ret3 = re.findall('^000',a)                # []
ret4 = re.findall('000$',a)                # []

print(ret3)
8. 匹配模式参数
# . 匹配错除了换行符\n以外其他的所有字符
# re.I 忽略大小写
# re.S 可以匹配包含换行符的所有字符
a = 'Pythonc#\nPythonPython'

ret = re.findall('C#{1}',a, re.I)                # [c#]
ret1 = re.findall('C#.{1}',a, re.I)                # []
ret2 = re.findall('C#.{1}',a, re.I | re.S)         # ['c#\n']

print(ret)
9. re.sub正则替换
a = 'Pythonc#Pythonc#Pythc#on'

def convert(value):
    matched = value.group()
    return "!"+ matched +"!"

ret = re .sub('c#', convert, a)

print(ret)         # Python!c#!Python!c#!Pyth!c#!on
10. match, search
a = 'Ab34nkn423h2kl4999999'

ret = re.match('\d', a)              # None       match会匹配第一个如果匹配不到会返回 None

ret = re.search('\d', a)             # <_sre.SRE_Match object; span=(2, 3), match='3'> 会返回第一个匹配到的对象
# ret = ret.group()                   # group() 方法会返回具体的内容
print(ret)         # Python!c#!Python!c#!Pyth!c#!on
11. group分组
a = 'life is short, i use python, i love python'
# 1

ret = re.search('life(.*)python(.*)python', a)
ret = ret.groups()                             # (' is short, i use ', ', i love ')

# 2
ret2 = re.search('life(.*)python(.*)python', a)   # group(0) 会返回全部匹配到的
ret2 = ret2.group(1)                            # is short, i use

ret = re.findall('life (.*) python, (.*)',a) # [('is short, i use', 'i love python')]

print(ret2)
©著作权归作者所有,转载或内容合作请联系作者
  • 序言:七十年代末,一起剥皮案震惊了整个滨河市,随后出现的几起案子,更是在滨河造成了极大的恐慌,老刑警刘岩,带你破解...
    沈念sama阅读 159,117评论 4 362
  • 序言:滨河连续发生了三起死亡事件,死亡现场离奇诡异,居然都是意外死亡,警方通过查阅死者的电脑和手机,发现死者居然都...
    沈念sama阅读 67,328评论 1 293
  • 文/潘晓璐 我一进店门,熙熙楼的掌柜王于贵愁眉苦脸地迎上来,“玉大人,你说我怎么就摊上这事。” “怎么了?”我有些...
    开封第一讲书人阅读 108,839评论 0 243
  • 文/不坏的土叔 我叫张陵,是天一观的道长。 经常有香客问我,道长,这世上最难降的妖魔是什么? 我笑而不...
    开封第一讲书人阅读 44,007评论 0 206
  • 正文 为了忘掉前任,我火速办了婚礼,结果婚礼上,老公的妹妹穿的比我还像新娘。我一直安慰自己,他们只是感情好,可当我...
    茶点故事阅读 52,384评论 3 287
  • 文/花漫 我一把揭开白布。 她就那样静静地躺着,像睡着了一般。 火红的嫁衣衬着肌肤如雪。 梳的纹丝不乱的头发上,一...
    开封第一讲书人阅读 40,629评论 1 219
  • 那天,我揣着相机与录音,去河边找鬼。 笑死,一个胖子当着我的面吹牛,可吹牛的内容都是我干的。 我是一名探鬼主播,决...
    沈念sama阅读 31,880评论 2 313
  • 文/苍兰香墨 我猛地睁开眼,长吁一口气:“原来是场噩梦啊……” “哼!你这毒妇竟也来了?” 一声冷哼从身侧响起,我...
    开封第一讲书人阅读 30,593评论 0 198
  • 序言:老挝万荣一对情侣失踪,失踪者是张志新(化名)和其女友刘颖,没想到半个月后,有当地人在树林里发现了一具尸体,经...
    沈念sama阅读 34,313评论 1 243
  • 正文 独居荒郊野岭守林人离奇死亡,尸身上长有42处带血的脓包…… 初始之章·张勋 以下内容为张勋视角 年9月15日...
    茶点故事阅读 30,575评论 2 246
  • 正文 我和宋清朗相恋三年,在试婚纱的时候发现自己被绿了。 大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
    茶点故事阅读 32,066评论 1 260
  • 序言:一个原本活蹦乱跳的男人离奇死亡,死状恐怖,灵堂内的尸体忽然破棺而出,到底是诈尸还是另有隐情,我是刑警宁泽,带...
    沈念sama阅读 28,392评论 2 253
  • 正文 年R本政府宣布,位于F岛的核电站,受9级特大地震影响,放射性物质发生泄漏。R本人自食恶果不足惜,却给世界环境...
    茶点故事阅读 33,052评论 3 236
  • 文/蒙蒙 一、第九天 我趴在偏房一处隐蔽的房顶上张望。 院中可真热闹,春花似锦、人声如沸。这庄子的主人今日做“春日...
    开封第一讲书人阅读 26,082评论 0 8
  • 文/苍兰香墨 我抬头看了看天上的太阳。三九已至,却和暖如春,着一层夹袄步出监牢的瞬间,已是汗流浃背。 一阵脚步声响...
    开封第一讲书人阅读 26,844评论 0 195
  • 我被黑心中介骗来泰国打工, 没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留,地道东北人。 一个月前我还...
    沈念sama阅读 35,662评论 2 274
  • 正文 我出身青楼,却偏偏与公主长得像,于是被迫代替她去往敌国和亲。 传闻我的和亲对象是个残疾皇子,可洞房花烛夜当晚...
    茶点故事阅读 35,575评论 2 270

推荐阅读更多精彩内容

  • Python中的正则表达式(re) import rere.match #从开始位置开始匹配,如果开头没有则无re...
    BigJeffWang阅读 6,931评论 0 99
  • re模块手册 本模块提供了和Perl里的正则表达式类似的功能,不关是正则表达式本身还是被搜索的字符串,都可以...
    喜欢吃栗子阅读 3,904评论 0 13
  • python的re模块--细说正则表达式 可能是东半球最详细最全面的re教程,翻译自官方文档,因为官方文档写的是真...
    立而人阅读 22,708评论 4 46
  • 火烛光阴过半城,风雨临顶绵无声。红袖身畔静相伴,烂漫风雨夜归人。
    胡说教育阅读 471评论 0 1
  • 很感谢我的这份工作,给我带来了金钱收入,还给我的人生带来了很多不一样的体验。视角开阔了,不在仅限于材米油盐的琐碎事...
    思言悟语阅读 119评论 0 3