后端开发|Python教程
re模块
后端开发-Python教程
本篇文章给大家带来的内容是关于python正则表达式中re模块的使用方法有哪些?re模块用法介绍,有一定的参考价值,有需要的朋友可以参考一下,希望对你有所帮助。
暴利源码商城,ubuntu激活显卡,tomcat在外部打不开,linux 爬虫 代理,php写api接口实例,宁夏短视频seo优化推广布局lzw
正则是处理字符串最常用的方法,我们编码中到处可见正则的身影。
wpf 销售统计报表图示例源码,ubuntu 脚本怎么写,tomcat 用不了了,python 图片爬虫,php对象常驻内存吗,seo大佬lzw
正则大同小异,python 中的正则跟其他语言相比略有差异:
导购分享网站源码带数据,ubuntu系统壁纸软件,tomcat安装自签发证书,爬虫sign加密,php常用的输出语句有,莆田新站seolzw
1、替换字符串时,替换的字符串可以是一个函数
2、split 函数可以指定分割次数,这会导致有个坑
3、前项界定的表达式必须定长
下面详细描述下re模块的使用方法,其实,注意上面提到的三点差异就好
1、match
说明:
re.match 尝试从字符串的起始位置匹配一个模式,如果不是起始位置匹配成功的话,match()就返回 None。
语法:
re.match(pattern, string, flags=0)
flags为可选标识,多个标识可以通过按位或 (|) 来指定。如 re.I | re.M 被设置成 I 和 M 标识:
匹配成功re.match方法返回一个匹配的对象,可以使用group(num) 或 groups() 匹配对象函数来获取匹配表达式。group() 或 group(0),返回整个正则表达式的匹配结果。
举例:
s= abc123abcprint(re.match([a-z]+, s))# print(re.match([a-z]+, s).group(0))# abcprint(re.match([\d]+, s))# Noneprint(re.match([A-Z]+, s, re.I).group(0)) # abcprint(re.match([a-z]+, s).span())# (0, 3)
2、search
说明:
re.search 扫描整个字符串并返回第一个成功的匹配。
语法:
re.search(pattern, string, flags=0)
匹配成功re.search方法返回一个匹配的对象,否则返回None。可以使用group(num) 或 groups() 匹配对象函数来获取匹配表达式。
举例:
s = abc123abcprint(re.search([a-z]+, s).group())# abcprint(re.search([a-z]+, s).span()) # (0, 3)print(re.search([\d]+, s).group()) # 123print(re.search([\d]+, s).span()) # (3, 6)print(re.search(xyz, s)) # None
groupdict
groupdict 返回匹配到的所有命名子组的字典。
print(re.search([a-z]+, s).groupdict())# {}print(re.search((?P[a-z]+)(?P\d+), s).groupdict()) # { um: 123, letter: abc}
3、sub 和 subn
说明:
re.sub用于替换字符串中的匹配项。
re.subn返回一个元组,包含替换后的字符串及替换次数。
语法:
sub(pattern, repl, string, count=0, flags=0)
repl: 替换的字符串,也可为一个函数。
count: 模式匹配后替换的最大次数,默认 0 表示替换所有的匹配。
举例:
s = abc123abcprint(re.sub([\d]+, 数字, s)) # abc数字abcprint(re.sub([a-z]+, 字母, s, 1)) # 字母123abc# 将匹配的数字乘以 2def double(matched): value = int(matched.group(value)) return str(value * 2)# repl是一个函数print(re.sub((?P\d+), double, s))# abc246abcprint(re.subn([\d]+, 数字, s)) # (abc数字abc, 1)print(re.subn([a-z]+, 字母, s,))# (字母123字母, 2)print(re.subn([a-z]+, 字母, s, 1)) # (字母123字母, 1)
4、compile
说明:
pile 用于编译正则表达式,生成一个正则表达式(Pattern)对象,供 match() 和 search() 这两个函数使用。
语法:
compile(pattern, flags=0)
举例:
s = abc123abcp = pile([\d]+)print(p.match(s, 4, 5).group(0)) # 2 从位置4开始匹配到位置5print(p.search(s).group(0)) # 123
5、findall
说明:
re.findall 在字符串中查找正则表达式所匹配的所有子串,并返回一个列表,如果没有找到匹配的,则返回空列表。
语法:
findall(pattern, string, flags=0)
举例:
s = abc123abcprint(re.findall([a-z]+, s)) # [abc, abc]print(re.findall([h-n]+, s)) # []
6、finditer
说明:
finditer和 findall 类似,在字符串中查找正则表达式所匹配的所有子串,并把它们作为一个迭代器返回。
语法:
finditer(pattern, string, flags=0)
举例:
s = abc123defit = re.finditer([a-z]+, s)for match in it: print(match.group())
7、split
说明:
re.split 方法按照能够匹配的子串将字符串分割后返回列表。
语法:
split(pattern, string, maxsplit=0, flags=0)
maxsplit:分隔次数,maxsplit=1 分隔一次,默认为 0,不限制次数。
举例:
print(re.split(a, 1A1a2A3, re.I)) # [1A1, 2A3]# 输出结果并未能区分大小写,这是因为re.split(pattern,string,maxsplit, flags)默认是四个参数,当我们传入的三个参数的时候,系统会默认re.I是第三个参数,所以就没起作用。# 如果想让这里的re.I起作用,写成flags=re.I即可。print(re.split(a, 1A1a2A3, flags=re.I))# [1, 1, 2, 3]
8、escape
说明:
re.escape对字符串里面的特殊字符串进行转义。
语法:
escape(pattern)
举例:
print(re.escape(\)) # www\.dxy\.cn
9、正则
“(?P…)”:分组,并将其命名为。
“(?P=name)”:引用别名为的分组匹配到的串。
10、前项(否定)界定中的特殊
正则中常用的前项界定(?<=exp)和前项否定界定(?<!exp)在 python 中会报错:look-behind requires fixed-width pattern,原因是 python 中前项界定的表达式必须是定长的,例如
(?<=aaa) # 正确(?<=aaa|bbb) # 正确(?<=aaa|bb)# 错误(?<=\d+) # 错误(?<=\d{3}) # 正确
python中logging模块有什么用?logging模块的用法介绍
python模块之re正则表达式详细介绍