正则表达式

1. 元字符

import re

a = 'dfsdfpy111thondf123123123dfd'

ret = re.findall('\D',a)

# \d 匹配数字 \D 匹配非数字
print(ret)

2. 字符集

import re

a = 'abc, acc, adc, aec, afc, ahc'

ret = re.findall('a[cf]c',a)       # ['acc', 'afc']
ret1 = re.findall('a[^cf]c',a)     # ['abc', 'adc', 'aec', 'ahc'] ^会去反
ret2 = re.findall('a[c-f]c',a)     # ['acc', 'adc', 'aec', 'afc']

print(ret2)

3. 概况字符集

# \w 单词字符 \W
# \s 空白字符 \S
import re

a = 'abc\n4\s342 fdf\ra\tahc'

ret = re.findall('\s',a)           # ['\n', ' ', '\r', '\t']
ret1 = re.findall('\W',a)          # ['\n', '\\', ' ', '\r', '\t']
ret2 = re.findall('\w',a)          # ['a', 'b', 'c', '4', 's', '3', '4', '2', 'f', 'd', 'f', 'a', 'a', 'h', 'c']
print(ret2)

4. 数量词

import re

a = 'python php java'
ret = re.findall('[a-z]{3,6}',a)       # ['python', 'php', 'java']

print(ret)

5. 贪婪模式

import re

a = 'pythonq12334 php24111444java'
# 默认是贪婪模式,会匹配更多的字符,也就是 6
# 非贪婪模式后面加 ? 会尽肯能少的匹配
ret = re.findall('[a-z]{3,6}',a)    # ['python', 'php', 'java']
ret1 = re.findall('[a-z]{3,6}?',a)  # ['pyt', 'hon', 'php', 'jav']

print(ret)

6. 匹配0次1次或者无限多次

import re
# * 匹配0次或者更多次
#  + 匹配一次或者更多次
# ? 匹配0次或者一次
# 这里匹配的是n  !
a = 'ipytho12334 python24111pythonn444java'
ret1 = re.findall('python*',a)               # ['pytho', 'python', 'pythonn']
ret2 = re.findall('python+',a)              # ['python', 'pythonn']
ret3 = re.findall('python?',a)              # ['pytho', 'python', 'python']
ret4 = re.findall('python{1,2}',a)          # ['python', 'pythonn']
ret5 = re.findall('python{1,2}?',a)          # ['python', 'python']

print(ret4)

7. 边界

import re

a = '1000001'           # len=7

ret = re.findall('\d{4,6}',a)              # ['100000']
ret1 = re.findall('^\d{4,7}$',a)           # ['1000001']
ret2 = re.findall('000',a)                 # [000]
ret3 = re.findall('^000',a)                # []
ret4 = re.findall('000$',a)                # []

print(ret3)

8. 匹配模式参数

# . 匹配错除了换行符\n以外其他的所有字符
# re.I 忽略大小写
# re.S 可以匹配包含换行符的所有字符
a = 'Pythonc#\nPythonPython'

ret = re.findall('C#{1}',a, re.I)                # [c#]
ret1 = re.findall('C#.{1}',a, re.I)                # []
ret2 = re.findall('C#.{1}',a, re.I | re.S)         # ['c#\n']

print(ret)

9. re.sub正则替换

a = 'Pythonc#Pythonc#Pythc#on'

def convert(value):
    matched = value.group()
    return "!"+ matched +"!"

ret = re .sub('c#', convert, a)

print(ret)         # Python!c#!Python!c#!Pyth!c#!on

10. match, search

a = 'Ab34nkn423h2kl4999999'

ret = re.match('\d', a)              # None       match会匹配第一个如果匹配不到会返回 None

ret = re.search('\d', a)             # <_sre.SRE_Match object; span=(2, 3), match='3'> 会返回第一个匹配到的对象
# ret = ret.group()                   # group() 方法会返回具体的内容
print(ret)         # Python!c#!Python!c#!Pyth!c#!on

11. group分组

a = 'life is short, i use python, i love python'
# 1

ret = re.search('life(.*)python(.*)python', a)
ret = ret.groups()                             # (' is short, i use ', ', i love ')

# 2
ret2 = re.search('life(.*)python(.*)python', a)   # group(0) 会返回全部匹配到的
ret2 = ret2.group(1)                            # is short, i use

ret = re.findall('life (.*) python, (.*)',a) # [('is short, i use', 'i love python')]

print(ret2)

人面猴
序言：七十年代末，一起剥皮案震惊了整个滨河市，随后出现的几起案子，更是在滨河造成了极大的恐慌，老刑警刘岩，带你破解...
沈念sama阅读 159,117评论 4赞 362
死咒
序言：滨河连续发生了三起死亡事件，死亡现场离奇诡异，居然都是意外死亡，警方通过查阅死者的电脑和手机，发现死者居然都...
沈念sama阅读 67,328评论 1赞 293
救了他两次的神仙让他今天三更去死
文/潘晓璐我一进店门，熙熙楼的掌柜王于贵愁眉苦脸地迎上来，“玉大人，你说我怎么就摊上这事。” “怎么了？”我有些...
开封第一讲书人阅读 108,839评论 0赞 243
道士缉凶录：失踪的卖姜人
文/不坏的土叔我叫张陵，是天一观的道长。经常有香客问我，道长，这世上最难降的妖魔是什么？我笑而不...
开封第一讲书人阅读 44,007评论 0赞 206
港岛之恋（遗憾婚礼）
正文为了忘掉前任，我火速办了婚礼，结果婚礼上，老公的妹妹穿的比我还像新娘。我一直安慰自己，他们只是感情好，可当我...
茶点故事阅读 52,384评论 3赞 287
恶毒庶女顶嫁案：这布局不是一般人想出来的
文/花漫我一把揭开白布。她就那样静静地躺着，像睡着了一般。火红的嫁衣衬着肌肤如雪。梳的纹丝不乱的头发上，一...
开封第一讲书人阅读 40,629评论 1赞 219
城市分裂传说
那天，我揣着相机与录音，去河边找鬼。笑死，一个胖子当着我的面吹牛，可吹牛的内容都是我干的。我是一名探鬼主播，决...
沈念sama阅读 31,880评论 2赞 313
双鸳鸯连环套：你想象不到人心有多黑
文/苍兰香墨我猛地睁开眼，长吁一口气：“原来是场噩梦啊……” “哼！你这毒妇竟也来了？” 一声冷哼从身侧响起，我...
开封第一讲书人阅读 30,593评论 0赞 198
万荣杀人案实录
序言：老挝万荣一对情侣失踪，失踪者是张志新（化名）和其女友刘颖，没想到半个月后，有当地人在树林里发现了一具尸体，经...
沈念sama阅读 34,313评论 1赞 243
护林员之死
正文独居荒郊野岭守林人离奇死亡，尸身上长有42处带血的脓包…… 初始之章·张勋以下内容为张勋视角年9月15日...
茶点故事阅读 30,575评论 2赞 246
白月光启示录
正文我和宋清朗相恋三年，在试婚纱的时候发现自己被绿了。大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
茶点故事阅读 32,066评论 1赞 260
活死人
序言：一个原本活蹦乱跳的男人离奇死亡，死状恐怖，灵堂内的尸体忽然破棺而出，到底是诈尸还是另有隐情，我是刑警宁泽，带...
沈念sama阅读 28,392评论 2赞 253
日本核电站爆炸内幕
正文年R本政府宣布，位于F岛的核电站，受9级特大地震影响，放射性物质发生泄漏。R本人自食恶果不足惜，却给世界环境...
茶点故事阅读 33,052评论 3赞 236
男人毒药：我在死后第九天来索命
文/蒙蒙一、第九天我趴在偏房一处隐蔽的房顶上张望。院中可真热闹，春花似锦、人声如沸。这庄子的主人今日做“春日...
开封第一讲书人阅读 26,082评论 0赞 8
一桩弑父案，背后竟有这般阴谋
文/苍兰香墨我抬头看了看天上的太阳。三九已至，却和暖如春，着一层夹袄步出监牢的瞬间，已是汗流浃背。一阵脚步声响...
开封第一讲书人阅读 26,844评论 0赞 195
情欲美人皮
我被黑心中介骗来泰国打工，没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留，地道东北人。一个月前我还...
沈念sama阅读 35,662评论 2赞 274
代替公主和亲
正文我出身青楼，却偏偏与公主长得像，于是被迫代替她去往敌国和亲。传闻我的和亲对象是个残疾皇子，可洞房花烛夜当晚...
茶点故事阅读 35,575评论 2赞 270

正则表达式

1. 元字符

2. 字符集

3. 概况字符集

4. 数量词

5. 贪婪模式

6. 匹配0次1次或者无限多次

7. 边界

8. 匹配模式参数

9. re.sub正则替换

10. match, search

11. group分组

推荐阅读更多精彩内容