200字范文 > python正则表达式中re模块的使用方法有哪些？re模块用法介绍

python正则表达式中re模块的使用方法有哪些？re模块用法介绍

时间：2022-04-11 03:15:30

后端开发|Python教程

re模块

后端开发-Python教程

本篇文章给大家带来的内容是关于python正则表达式中re模块的使用方法有哪些？re模块用法介绍，有一定的参考价值，有需要的朋友可以参考一下，希望对你有所帮助。

暴利源码商城,ubuntu激活显卡,tomcat在外部打不开,linux 爬虫代理,php写api接口实例,宁夏短视频seo优化推广布局lzw

正则是处理字符串最常用的方法，我们编码中到处可见正则的身影。

wpf 销售统计报表图示例源码,ubuntu 脚本怎么写,tomcat 用不了了,python 图片爬虫,php对象常驻内存吗,seo大佬lzw

正则大同小异，python 中的正则跟其他语言相比略有差异：

导购分享网站源码带数据,ubuntu系统壁纸软件,tomcat安装自签发证书,爬虫sign加密,php常用的输出语句有,莆田新站seolzw

1、替换字符串时，替换的字符串可以是一个函数

2、split 函数可以指定分割次数，这会导致有个坑

3、前项界定的表达式必须定长

下面详细描述下re模块的使用方法，其实，注意上面提到的三点差异就好

1、match

说明：

re.match 尝试从字符串的起始位置匹配一个模式，如果不是起始位置匹配成功的话，match()就返回 None。

语法：

re.match(pattern, string, flags=0)

flags为可选标识，多个标识可以通过按位或 (|) 来指定。如 re.I | re.M 被设置成 I 和 M 标识：

匹配成功re.match方法返回一个匹配的对象，可以使用group(num) 或 groups() 匹配对象函数来获取匹配表达式。group() 或 group(0)，返回整个正则表达式的匹配结果。

举例：

s= abc123abcprint(re.match([a-z]+, s))# print(re.match([a-z]+, s).group(0))# abcprint(re.match([\d]+, s))# Noneprint(re.match([A-Z]+, s, re.I).group(0)) # abcprint(re.match([a-z]+, s).span())# (0, 3)

2、search

说明：

re.search 扫描整个字符串并返回第一个成功的匹配。

语法：

re.search(pattern, string, flags=0)

匹配成功re.search方法返回一个匹配的对象，否则返回None。可以使用group(num) 或 groups() 匹配对象函数来获取匹配表达式。

举例：

s = abc123abcprint(re.search([a-z]+, s).group())# abcprint(re.search([a-z]+, s).span()) # (0, 3)print(re.search([\d]+, s).group()) # 123print(re.search([\d]+, s).span()) # (3, 6)print(re.search(xyz, s)) # None

groupdict

groupdict 返回匹配到的所有命名子组的字典。

print(re.search([a-z]+, s).groupdict())# {}print(re.search((?P[a-z]+)(?P\d+), s).groupdict()) # { um: 123, letter: abc}

3、sub 和 subn

说明：

re.sub用于替换字符串中的匹配项。

re.subn返回一个元组，包含替换后的字符串及替换次数。

语法：

sub(pattern, repl, string, count=0, flags=0)

repl: 替换的字符串，也可为一个函数。

count: 模式匹配后替换的最大次数，默认 0 表示替换所有的匹配。

举例：

s = abc123abcprint(re.sub([\d]+, 数字, s)) # abc数字abcprint(re.sub([a-z]+, 字母, s, 1)) # 字母123abc# 将匹配的数字乘以 2def double(matched): value = int(matched.group(value)) return str(value * 2)# repl是一个函数print(re.sub((?P\d+), double, s))# abc246abcprint(re.subn([\d]+, 数字, s)) # (abc数字abc, 1)print(re.subn([a-z]+, 字母, s,))# (字母123字母, 2)print(re.subn([a-z]+, 字母, s, 1)) # (字母123字母, 1)

4、compile

说明：

pile 用于编译正则表达式，生成一个正则表达式（Pattern）对象，供 match() 和 search() 这两个函数使用。

语法：

compile(pattern, flags=0)

举例：

s = abc123abcp = pile([\d]+)print(p.match(s, 4, 5).group(0)) # 2 从位置4开始匹配到位置5print(p.search(s).group(0)) # 123

5、findall

说明：

re.findall 在字符串中查找正则表达式所匹配的所有子串，并返回一个列表，如果没有找到匹配的，则返回空列表。

语法：

findall(pattern, string, flags=0)

举例：

s = abc123abcprint(re.findall([a-z]+, s)) # [abc, abc]print(re.findall([h-n]+, s)) # []

6、finditer

说明：

finditer和 findall 类似，在字符串中查找正则表达式所匹配的所有子串，并把它们作为一个迭代器返回。

语法：

finditer(pattern, string, flags=0)

举例：

s = abc123defit = re.finditer([a-z]+, s)for match in it: print(match.group())

7、split

说明：

re.split 方法按照能够匹配的子串将字符串分割后返回列表。

语法：

split(pattern, string, maxsplit=0, flags=0)

maxsplit：分隔次数，maxsplit=1 分隔一次，默认为 0，不限制次数。

举例：

print(re.split(a, 1A1a2A3, re.I)) # [1A1, 2A3]# 输出结果并未能区分大小写，这是因为re.split(pattern，string，maxsplit, flags)默认是四个参数，当我们传入的三个参数的时候，系统会默认re.I是第三个参数，所以就没起作用。# 如果想让这里的re.I起作用，写成flags=re.I即可。print(re.split(a, 1A1a2A3, flags=re.I))# [1, 1, 2, 3]

8、escape

说明：

re.escape对字符串里面的特殊字符串进行转义。

语法：

escape(pattern)

举例：

print(re.escape(\)) # www\.dxy\.cn

9、正则

“(?P…)”：分组，并将其命名为。

“(?P=name)”：引用别名为的分组匹配到的串。

10、前项（否定）界定中的特殊

正则中常用的前项界定(?<=exp)和前项否定界定(?<!exp)在 python 中会报错：look-behind requires fixed-width pattern，原因是 python 中前项界定的表达式必须是定长的，例如