pandas.Series.str.findall #

系列.str。findall ( pat , flags = 0 ) [来源] #

查找系列/索引中所有出现的模式或正则表达式。

相当于应用于re.findall()系列/索引中的所有元素。

参数
帕特斯特

模式或正则表达式。

flags int,默认0

来自模块的标志re,例如re.IGNORECASE(默认为 0,这意味着没有标志)。

返回
字符串列表的系列/索引

该系列/索引的每个字符串中模式或正则表达式的所有非重叠匹配。

也可以看看

count

计算系列/索引的每个字符串中模式或正则表达式的出现次数。

extractall

对于系列中的每个字符串,从正则表达式的所有匹配中提取组,并返回一个 DataFrame,其中每个匹配对应一行,每个组对应一列。

re.findall

与字符串中模式或正则表达式的所有非重叠匹配的等效re函数,作为字符串列表。

例子

>>> s = pd.Series(['Lion', 'Monkey', 'Rabbit'])

对模式“Monkey”的搜索返回一个匹配项:

>>> s.str.findall('Monkey')
0          []
1    [Monkey]
2          []
dtype: object

另一方面,搜索模式“MONKEY”不会返回任何匹配项:

>>> s.str.findall('MONKEY')
0    []
1    []
2    []
dtype: object

可以将标志添加到模式或正则表达式中。例如,要查找模式“MONKEY”,忽略大小写:

>>> import re
>>> s.str.findall('MONKEY', flags=re.IGNORECASE)
0          []
1    [Monkey]
2          []
dtype: object

当模式与系列中的多个字符串匹配时,将返回所有匹配项:

>>> s.str.findall('on')
0    [on]
1    [on]
2      []
dtype: object

也支持正则表达式。例如,搜索所有以单词“on”结尾的字符串,如下所示:

>>> s.str.findall('on$')
0    [on]
1      []
2      []
dtype: object

如果在同一字符串中多次找到该模式,则返回多个字符串的列表:

>>> s.str.findall('b')
0        []
1        []
2    [b, b]
dtype: object