200字范文,内容丰富有趣,生活中的好帮手!
200字范文 > python正则表达式re模块之findall函数

python正则表达式re模块之findall函数

时间:2018-07-28 01:57:10

相关推荐

python正则表达式re模块之findall函数

python正则表达式re模块之findall函数

1. re.findall函数介绍2. findall函数捕获分组3. re.findall中正则表达式(.*?)4. re.findall中参数re.S的意义

1. re.findall函数介绍

findall()函数在re模块中的定义如下:

def findall(pattern, string, flags=0):"""Return a list of all non-overlapping matches in the string.If one or more capturing groups are present in the pattern, returna list of groups; this will be a list of tuples if the patternhas more than one group.Empty matches are included in the result."""return _compile(pattern, flags).findall(string)

它返回string中所有与pattern匹配的全部字符串,返回形式为列表,如果pattern中含有分组,返回分组的匹配结果。如果有pattern中有多个分组,则返回元组列表。

findall()函数的调用有两种表示形式,其实所有的python正则函数,都用这两种调用方式,详细可以参看博客:python正则表达式与re模块

import rekk = pile(r'\d+')kk.findall('one1two2three3four4')#[1,2,3,4]#注意此处findall()的用法,可传两个参数;kk = pile(r'\d+')re.findall(kk,"one123")#[1,2,3]

示例代码:

import restr = 'aabbabaabbaa'# 一个"."就是匹配除 \n (换行符)以外的任意一个字符print(re.findall(r'a.b', str)) # ['aab', 'aab']# *前面的字符出现0次或以上print(re.findall(r'a*b', str)) # ['aab', 'b', 'ab', 'aab', 'b']

输出结果:

['aab', 'aab']['aab', 'b', 'ab', 'aab', 'b']

2. findall函数捕获分组

实际上这并不是python特有的,这是正则所特有的 , 任何一门高级语言使用正则都满足这个特点:有括号时只能匹配到括号中的内容,没有括号【相当于在最外层增加了一个括号】。在正则里面 “()” 代表的是分组的意思,一个括号代表一个分组,你只能匹配到 “()” 中的内容。

import restr = 'aabpythonbaregexa,aabpythonbacoola'#分组搜索print(re.findall(r'a(.+?)a', str))print(re.findall(r'a(.*?)a', str))print(re.findall(r'b(.*?)b.*?a(.*?)a', str))

嵌套括号:

import restring="abcdefg acbdgef abcdgfe cadbgfe"#不带括号regex=pile("((\w+)\s+\w+)")print(regex.findall(string))#输出:[('abcdefg acbdgef', 'abcdefg'), ('abcdgfe cadbgfe', 'abcdgfe')]regex1=pile("(\w+)\s+\w+")print(regex1.findall(string))#输出:['abcdefg', 'abcdgfe']regex2=pile("\w+\s+\w+")print(regex2.findall(string))#输出:['abcdefg acbdgef', 'abcdgfe cadbgfe']

3. re.findall中正则表达式(.*?)

import restr = 'aabpythonbaregexa,aabpythonbacoola'#分组搜索# aa中间的字符出现一次以上print(re.findall(r'a(.+?)a', str))# aa中间的字符出现0次或者多次print(re.findall(r'a(.*?)a', str))# 多个分组捕获print(re.findall(r'b(.*?)b.*?a(.*?)a', str))

输出结果:

['abpythonb', ',', 'bpythonb']['', 'regex', '', 'cool'][('python', 'regex'), ('python', 'cool')]

4. re.findall中参数re.S的意义

import restr = '''aabbabaabbaabb''' # 后面多加了2个b# 参数无re.S,没有把最后一个换行的aab算进来print(re.findall(r'a.*?b', str)) # ['aab', 'ab', 'aab']# re.S不会对\n进行中断print(re.findall(r'a.*?b', str, re.S)) # ['aab', 'ab', 'aab', 'aa\n b']

输出结果:

['aab', 'ab', 'aab']['aab', 'ab', 'aab', 'aa\n b']

Python 正则表达式re模块之findall()详解

本内容不代表本网观点和政治立场,如有侵犯你的权益请联系我们处理。
网友评论
网友评论仅供其表达个人看法,并不表明网站立场。