Python正则表达re模块之findall()函数详解

一、re.findall函数介绍

它在re.py中有定义：

def findall(pattern, string, flags=0):
    """Return a list of all non-overlapping matches in the string.
    If one or more capturing groups are present in the pattern, return
    a list of groups; this will be a list of tuples if the pattern
    has more than one group.
    Empty matches are included in the result."""
    return _compile(pattern, flags).findall(string)

返回string中所有与pattern匹配的全部字符串,返回形式为数组。

findall()函数的两种表示形式

import re
kk = re.compile(r'\d+')
kk.findall('one1two2three3four4')
#[1,2,3,4]
#注意此处findall()的用法，可传两个参数;
kk = re.compile(r'\d+')
re.findall(kk,"one123")
#[1,2,3]

二、实例代码

后面会讲解代码里的各个部分，先列出来~

import re
str = 'aabbabaabbaa'
# 一个"."就是匹配除 \n (换行符)以外的任意一个字符
print(re.findall(r'a.b',str))#['aab', 'aab']
# *前面的字符出现0次或以上
print(re.findall(r'a*b',str))#['aab', 'b', 'ab', 'aab', 'b']
# 贪婪，匹配从.*前面为开始到后面为结束的所有内容
print(re.findall(r'a.*b',str))#['aabbabaabb']
# 非贪婪，遇到开始和结束就进行截取，因此截取多次符合的结果，中间没有字符也会被截取
print(re.findall(r'a.*?b',str))#['aab', 'ab', 'aab']
# 非贪婪，与上面一样，只是与上面的相比多了一个括号，只保留括号的内容
print(re.findall(r'a(.*?)b',str))#['a', '', 'a']
str = '''aabbab
         aabbaa
         bb'''     #后面多加了2个b
# 没有把最后一个换行的aab算进来
print(re.findall(r'a.*?b',str))#['aab', 'ab', 'aab']
# re.S不会对\n进行中断
print(re.findall(r'a.*?b',str,re.S))#['aab', 'ab', 'aab', 'aa\n         b']

三、re.findall中正则表达式(.*?)

字符串是

str = 'aabbabaabbaa'

1. 符号 . 就是匹配除 \n (换行符)以外的任意一个字符

print(re.findall(r'a.b',str))
#['aab', 'aab']

2.符号 * 前面的字符出现0次或以上

print(re.findall(r'a*b',str))
#['aab', 'b', 'ab', 'aab', 'b']

3.符号.* 贪婪，匹配从.*前面为开始到后面为结束的所有内容

print(re.findall(r'a.*b',str))
#['aabbabaabb']

4.符号.*? 非贪婪，遇到开始和结束就进行截取，因此截取多次符合的结果，中间没有字符也会被截取

print(re.findall(r'a.*?b',str))
#['aab', 'ab', 'aab']

5.符号(.*?) 非贪婪，与上面一样，只是与上面的相比多了一个括号，只保留括号的内容

print(re.findall(r'a(.*?)b',str))
#['a', '', 'a']

关于带括号与不带括号的区别

import re
string="abcdefg  acbdgef  abcdgfe  cadbgfe"
#不带括号
regex=re.compile("((\w+)\s+\w+)")
print(regex.findall(string))
#输出：[('abcdefg  acbdgef', 'abcdefg'), ('abcdgfe  cadbgfe', 'abcdgfe')]
regex1=re.compile("(\w+)\s+\w+")
print(regex1.findall(string))
#输出：['abcdefg', 'abcdgfe']
regex2=re.compile("\w+\s+\w+")
print(regex2.findall(string))
#输出：['abcdefg  acbdgef', 'abcdgfe  cadbgfe']

第一个 regex 中带有2个括号，其输出list 中包含2个 tuple

第二个 regex 中带有1个括号，其输出内容是括号匹配到的内容，而不是整个表达式所匹配到的结果。

第三个 regex 中不带括号,其输出的内容就是整个表达式所匹配到的内容。

实际上这并不是python特有的，这是正则所特有的，任何一门高级语言使用正则都满足这个特点：有括号时只能匹配到括号中的内容，没有括号【相当于在最外层增加了一个括号】。在正则里面 "()" 代表的是分组的意思，一个括号代表一个分组，你只能匹配到 "()" 中的内容。

四、re.findall中参数re.S的意义

1.字符串变为（后面多加了2个b）

str = '''aabbab
         aabbaa
         bb'''

2.参数无re.S，没有把最后一个换行的aab算进来

print(re.findall(r'a.*?b',str))
#['aab', 'ab', 'aab']

3.参数有re.S，不会对\n进行中断

print(re.findall(r'a.*?b',str,re.S))
#['aab', 'ab', 'aab', 'aa\n         b']

参考

Python re.findall中正则表达式(.*?)和参数re.S使用

2. python re模块findall()详解

3. Python 正则re模块之findall()详解

总结

到此这篇关于Python正则表达re模块之findall()函数详解的文章就介绍到这了,更多相关Python正则表达re模块findall()内容请搜索易知道(ezd.cc)以前的文章或继续浏览下面的相关文章希望大家以后多多支持易知道(ezd.cc)！

Python正则表达re模块之findall()函数详解

推荐阅读

excel怎么用乘法函数

excel中乘法函数是什么？

标准差excel用什么函数？

电脑函数不正确|电脑出现函数不正确

excel函数公式快捷键|excel公式的快捷键

使用函数的快捷键固定|函数公式锁定快捷键

excel常用函数都有哪些？

Python之可迭代对象、迭代器、生成器

一种可以解决python读取文件中文出乱码的方

金蝶利润表本累计金额函数|金蝶K3利润表中

python快捷键功能|python中运行的快捷键

怎样在电脑上做函数图像|怎样在电脑上做函

wps表格做出函数表格|WPSEXCEL自定义函数

python获取当前系统的桌面的路径的四种方法

什么是递归的概念？递归函数通常是用来解决什