pandas.api.types.infer_dtype #

pandas.api.types。infer_dtype skipna = True#

返回标量或类似列表的值类型的字符串标签。

参数
标量、列表、ndarray 或 pandas 类型
Skipna布尔值,默认 True

推断类型时忽略 NaN 值。

返回
斯特

描述输入数据的常见类型。

结果可以包括:
  • 细绳
  • 字节
  • 漂浮的
  • 整数
  • 混合整数
  • 混合整数浮点
  • 小数
  • 复杂的
  • 绝对的
  • 布尔值
  • 日期时间64
  • 约会时间
  • 日期
  • 时间增量64
  • 时间增量
  • 时间
  • 时期
  • 混合的
  • 未知数组
加薪
类型错误

如果类似于 ndarray 但无法推断 dtype

笔记

  • “混合”是所有非专门化事物的统称

  • 'mixed-integer-float' 是浮点数和整数

  • “混合整数”是与非整数混合的整数

  • 'unknown-array' 是一个数组(具有 dtype 属性)的总称,但具有 pandas 未知的 dtype(例如外部扩展数组)

例子

>>> from pandas.api.types import infer_dtype
>>> infer_dtype(['foo', 'bar'])
'string'
>>> infer_dtype(['a', np.nan, 'b'], skipna=True)
'string'
>>> infer_dtype(['a', np.nan, 'b'], skipna=False)
'mixed'
>>> infer_dtype([b'foo', b'bar'])
'bytes'
>>> infer_dtype([1, 2, 3])
'integer'
>>> infer_dtype([1, 2, 3.5])
'mixed-integer-float'
>>> infer_dtype([1.0, 2.0, 3.5])
'floating'
>>> infer_dtype(['a', 1])
'mixed-integer'
>>> from decimal import Decimal
>>> infer_dtype([Decimal(1), Decimal(2.0)])
'decimal'
>>> infer_dtype([True, False])
'boolean'
>>> infer_dtype([True, False, np.nan])
'boolean'
>>> infer_dtype([pd.Timestamp('20130101')])
'datetime'
>>> import datetime
>>> infer_dtype([datetime.date(2013, 1, 1)])
'date'
>>> infer_dtype([np.datetime64('2013-01-01')])
'datetime64'
>>> infer_dtype([datetime.timedelta(0, 1, 1)])
'timedelta'
>>> infer_dtype(pd.Series(list('aabc')).astype('category'))
'categorical'