pandas.Series.unique # 系列。唯一( ) [来源] # 返回 Series 对象的唯一值。 唯一值按出现顺序返回。基于哈希表的唯一性,因此不排序。 返回: ndarray 或 ExtensionArray以 NumPy 数组形式返回的唯一值。参见注释。 也可以看看 Series.drop_duplicates返回已删除重复值的系列。 unique适用于任何一维数组对象的顶级唯一方法。 Index.unique从 Index 对象返回具有唯一值的 Index。 笔记 以 NumPy 数组的形式返回唯一值。如果是扩展数组支持的系列,则 ExtensionArray返回仅具有唯一值的该类型的新值。这包括 分类的 时期 带时区的日期时间 没有时区的日期时间 时间增量 间隔 疏 整数NA 请参阅示例部分。 例子 >>> pd.Series([2, 1, 3, 3], name='A').unique() array([2, 1, 3]) >>> pd.Series([pd.Timestamp('2016-01-01') for _ in range(3)]).unique() <DatetimeArray> ['2016-01-01 00:00:00'] Length: 1, dtype: datetime64[ns] >>> pd.Series([pd.Timestamp('2016-01-01', tz='US/Eastern') ... for _ in range(3)]).unique() <DatetimeArray> ['2016-01-01 00:00:00-05:00'] Length: 1, dtype: datetime64[ns, US/Eastern] 分类将按出现顺序返回具有相同数据类型的类别。 >>> pd.Series(pd.Categorical(list('baabc'))).unique() ['b', 'a', 'c'] Categories (3, object): ['a', 'b', 'c'] >>> pd.Series(pd.Categorical(list('baabc'), categories=list('abc'), ... ordered=True)).unique() ['b', 'a', 'c'] Categories (3, object): ['a' < 'b' < 'c']