pandas.arrays.SparseArray #

pandas.arrays。SparseArray数据 sparse_index = None fill_value = None kind = 'integer' dtype = None copy = False[来源]

用于存储稀疏数据的 ExtensionArray。

参数
类似数组或标量的数据

要存储在 SparseArray 中的密集值数组。这可能包含 fill_value

稀疏索引稀疏索引,可选
fill_value标量,可选

fill_value数据中未存储在 SparseArray 中的元素。为了节省内存,这应该是data中最常见的值。默认情况下,fill_value取决于data的 dtype :

数据类型

na_值

漂浮

np.nan

整数

0

布尔值

错误的

日期时间64

pd.NaT

时间增量64

pd.NaT

填充值可能以三种方式指定。按优先顺序排列,这些是

  1. fill_value参数

  2. dtype.fill_value如果fill_value为 None 并且dtypeSparseDtype

  3. data.dtype.fill_value如果fill_value为 None 并且dtype 不是 aSparseDtype并且data是 a SparseArray

善良的str

可以是“整数”或“块”,默认为“整数”。稀疏位置的存储类型。

  • 'block':存储稀疏值的每个连续范围的block_length 。当稀疏数据倾向于聚集在一起并且稀疏值之间存在大范围的值时,这是最好的。fill-value

  • 'integer':使用整数来存储每个稀疏值的位置。

dtype np.dtype 或 SparseDtype,可选

用于 SparseArray 的 dtype。对于 numpy dtypes,这决定了 的 dtype self.sp_values。对于 SparseDtype,这决定了self.sp_valuesself.fill_value

复制bool,默认 False

是否显式复制传入的数据数组。

例子

>>> from pandas.arrays import SparseArray
>>> arr = SparseArray([0, 0, 1, 2])
>>> arr
[0, 0, 1, 2]
Fill: 0
IntIndex
Indices: array([2, 3], dtype=int32)

属性

没有任何

方法

没有任何