1.0.2 的新增内容(2020 年 3 月 12 日)# 这些是 pandas 1.0.2 中的变化。请参阅发行说明以获取完整的变更日志,包括其他版本的 pandas。 固定回归# 通过...分组 修复了在具有列和自定义函数的框架上失败的DataFrameGroupBy.agg()回归( GH 31777 )SeriesGroupBy.agg()MultiIndex groupby(..).rolling(..).apply()修复了( RollingGroupby)中忽略参数的回归raw( GH 31754 ) rolling(..).corr()修复了使用时间偏移时的回归( GH 31789) 修复了回归,其中如果存在值groupby(..).nunique()则修改原始值( GH 31950)NaN 修复了从内部操作中DataFrame.groupby引发 a 的回归( GH 31802)ValueError 修复了在空输入上额外调用用户提供的函数的DataFrameGroupBy.agg()回归问题 ( GH 31760 )SeriesGroupBy.agg() 输入/输出 修复了某些类文件对象无法识别read_csv()该选项的回归( GH 31819)encoding 修复了传递关键字参数DataFrame.to_excel()时的回归( GH 31677)columns ExcelFile修复了传递到函数的流被析构函数关闭的回归。 ( GH 31467 ) 修复了在使用列(GH 31988 )读取 py27 pickle 时read_pickle()引发的回归问题。UnicodeDecodeErrorMultiIndex 重新索引/对齐 Series.align()修复了何时other是 aDataFrame和method何时不是的回归None(GH 31785) 修复了使用(tz-aware)索引和(GH 26683)重新索引DataFrame.reindex()时的回归Series.reindex()method=nearest 修复了子类DataFrame.reindex_like()中的回归问题(GH 31925)DataFrameAssertionError DataFrame修复了列不匹配的算术运算中的回归( GH 31623) 其他 修复了简单情况下加入DatetimeIndex或TimedeltaIndex保留的回归( GH 32166)freq 修复了传递整数时 dtype 的Series.shift()回归( GH 32591 )datetime64fill_value Index修复了具有布尔值和缺失值的对象数据类型的再现中的回归( GH 32146) 使用可为空的布尔数组进行索引# 以前使用包含可为空布尔数组的索引NA会引发 a ValueError,但是现在允许将其NA视为False。 ( GH 31503 ) In [1]: s = pd.Series([1, 2, 3, 4]) In [2]: mask = pd.array([True, True, False, None], dtype="boolean") In [3]: s Out[3]: 0 1 1 2 2 3 3 4 dtype: int64 In [4]: mask Out[4]: <BooleanArray> [True, True, False, <NA>] Length: 4, dtype: boolean 熊猫1.0.0-1.0.1 >>> s[mask] Traceback (most recent call last): ... ValueError: cannot mask with array containing NA / NaN values 熊猫1.0.2 In [5]: s[mask] Out[5]: 0 1 1 2 dtype: int64 Bug修复# 类似日期时间 Series.astype()不复制 tz-naive 和 tz-aware dtype 的错误datetime64( GH 32490 ) to_datetime()通过时会在哪里引发错误pd.NA(GH 32213) Timestamp改进了减go两个时导致越界的错误消息Timedelta(GH 31774) 分类的 修复了传递可为空整数代码时Categorical.from_codes()错误引发的错误。 ValueError(GH 31779) 修复了当给定包含 的 numpy 数组时Categorical()构造函数会引发 a 的错误。 (GH 31927)TypeErrorpd.NA 使用类似列表Categorical调用时会忽略或崩溃的错误(GH 31720)Series.replace()to_replace 输入/输出 现在使用pd.NAwithDataFrame.to_json()可以正确输出空值而不是空对象(GH 31615) pandas.json_normalize()当元路径中的值不可迭代时出现错误( GH 31507) 固定酸洗pandas.NA。之前返回了一个新对象,这破坏了依赖于NA单例的计算(GH 31847) 修复了带有可为空无符号整数数据类型的 parquet 往返中的错误 ( GH 31896 )。 实验数据类型 DataFrame.convert_dtypes()修复了已使用 dtype "string"( GH 31731 ) 的列中的错误。 DataFrame.convert_dtypes()修复了混合整数和字符串的系列中的错误( GH 32117) 修复了列转换为的DataFrame.convert_dtypes()错误(GH 32287)BooleanDtypeInt64 修复了使用带有字符串数据类型的切片索引器设置值时的错误(GH 31772) 修复了当对象 dtype 列中包含组时DataFrameGroupBy.first()、SeriesGroupBy.first()、DataFrameGroupBy.last()和SeriesGroupBy.last()会引发错误的错误 ( GH 32123 )TypeErrorpd.NA DataFrameGroupBy.mean()修复了、DataFrameGroupBy.median()、DataFrameGroupBy.var()和会在dtype 列上DataFrameGroupBy.std()引发 a 的错误( GH 32219 )TypeErrorInt64 弦乐 现在使用pd.NAwithSeries.str.repeat()可以正确输出空值,而不是引发向量输入错误(GH 31632) 滚动 修复了在递减时间索引 ( GH 32385 )上使用可变窗口(由持续时间定义)的滚动操作。 贡献者# 共有 25 人为此版本贡献了补丁。名字带有“+”的人首次贡献了补丁。 安娜·达格利斯 + 丹尼尔·萨克斯顿 欧夫·勒斯蒂格 扬·斯科达 乔里斯·范登博什 贾斯汀·郑 董凯琪 肯德尔·马塞 马可·戈雷利 马修·罗斯克 米塞克斯机器 妈妈是最好的朋友 熊猫开发团队 佩德罗·雷斯 + 普拉卡·潘迪 罗伯特·德·弗里斯 + 鲁沙布·瓦萨尼 西蒙·霍金斯 斯蒂恩·范霍伊 特尔吉·彼得森 汤姆·奥格斯普格 威廉·艾德 阿里姆大师1 格菲扬 杰布罗克门德尔