pandas.Series.duplicated #

系列。重复( keep = 'first' ) [来源] #

指示重复的系列值。

重复的值显示为True结果系列中的值。可以指示所有重复项、除了第一个重复项之外的所有重复项或除了最后一次出现的重复项之外的所有重复项。

参数
保留{'first', 'last', False},默认'first'

处理删除重复项的方法:

  • 'first' :将重复项标记为True除第一次出现之外的重复项。

  • 'last' :将重复项标记为True除最后一次出现之外的重复项。

  • False:将所有重复项标记为True

返回
系列[布尔]

指示每个值是否已出现在前面的值中的系列。

也可以看看

Index.duplicated

pandas.Index 上的等效方法。

DataFrame.duplicated

pandas.DataFrame 上的等效方法。

Series.drop_duplicates

从系列中删除重复值。

例子

默认情况下,对于每组重复值,第一次出现的值设置为 False,所有其他值设置为 True:

>>> animals = pd.Series(['llama', 'cow', 'llama', 'beetle', 'llama'])
>>> animals.duplicated()
0    False
1    False
2     True
3    False
4     True
dtype: bool

这相当于

>>> animals.duplicated(keep='first')
0    False
1    False
2     True
3    False
4     True
dtype: bool

通过使用“last”,每组重复值的最后一次出现设置为 False,所有其他值设置为 True:

>>> animals.duplicated(keep='last')
0     True
1    False
2     True
3    False
4    False
dtype: bool

通过设置 keep on False,所有重复项均为 True:

>>> animals.duplicated(keep=False)
0     True
1    False
2     True
3    False
4     True
dtype: bool