0.25.1 的新增内容(2019 年 8 月 21 日)#

这些是 pandas 0.25.1 中的更改。请参阅发行说明以获取完整的变更日志,包括其他版本的 pandas。

IO 和 LZMA #

一些用户可能在不知情的情况下安装了不完整的 Python,缺少lzma标准库中的模块。在本例中,由于( GH 27575 ) 而失败。如果模块不存在,pandas 现在会发出警告,而不是引发。任何后续尝试使用方法都会引发.解决缺少模块的可能方法是确保您拥有必要的库,然后重新安装 Python。例如,在 MacOS 上安装 Python可能会由于编译时未满足系统依赖关系而导致 Python 安装不完整(如)。编译会成功,但 Python 在运行时可能会失败。该问题可以通过安装必要的依赖项然后重新安装Python来解决。import pandasImportErrorImportErrorlzmalzmaRuntimeErrorlzmapyenvxz

Bug修复

分类#

  • 错误Categorical.fillna()将替换所有值,而不仅仅是那些NaNGH 26215

类似日期时间#

  • to_datetime()传递时区朴素DatetimeArrayDatetimeIndexandutc=True会错误地返回时区朴素结果的错误( GH 27733

  • 在实现Period.to_timestamp()范围Period之外Timestamp(大约 1677-09-21 到 2262-04-11)将返回错误Timestamp而不是引发的错误OutOfBoundsDatetimeGH 19643

  • DatetimeIndex当底层数据为只读时迭代出现错误( GH 28055 )

时区

  • Index具有时区感知功能的 numpy 对象数组Timestamp不会np.nan返回DatetimeIndex( GH 27011 )的错误

数字#

  • Series.interpolate()使用时区感知时出现错误DatetimeIndexGH 27548

  • 打印负浮点复数时的错误会引发IndexError( GH 27484 )

  • 算术运算符DataFrame(例如DataFrame.mul()带有 axis=1 的 a Series)会引发AttributeError大于DataFrame调用 numexpr 的最小阈值的错误(GH 27636

  • 算术中的错误DataFrame,其中结果中的缺失值被错误地掩盖,NaN而不是InfGH 27464

转换

  • 改进了已弃用方法的警告Series.real()Series.imag()GH 27610

间隔

  • IntervalIndex哪里dir(obj)会引发错误ValueErrorGH 27571

索引#

  • Series使用标量.loc['2015']GH 27516)进行索引时,部分字符串索引返回 NumPy 数组而不是 a 的错误

  • 打破涉及Index其他索引类的引用循环,以允许在不运行 GC 的情况下对索引对象进行垃圾回收。 (GH 27585GH 27840

  • 修复将值分配给具有列的 DataFrame 的单列时的回归MultiIndex( GH 27841 )。

  • .ix使用IntervalIndex( GH 27865 )修复回退中的回归。

丢失的

IO #

  • 读取 parquet 时避免调用S3File.s3,因为这在 s3fs 版本 0.3.0 中已删除(GH 27756

  • 传入负标头时出现更好的错误消息pandas.read_csv()( GH 27779 )

  • 正确遵循min_rows笔记本 ( GH 27991 ) 中 HTML 表示中的显示选项(在 v0.25.0 中引入)。

绘图#

GroupBy/重新采样/滚动#

  • pands.core.groupby.DataFrameGroupBy.quantile()修复了给出多个分位数时提升的回归( GH 27526

  • DataFrameGroupBy.transform()应用时区转换 lambda 函数会删除时区信息的错误( GH 27496 )

  • 分类石斑鱼被忽略的GroupBy.nth()错误(GH 26385observed=False

  • 只读数组上的窗口错误 ( GH 27766 )

  • 修复了.DataFrameGroupBy.quantile传递无效分位数时的段错误(GH 27470

重塑#

  • 现在,如果在 a 上跟注或使用不正确的名称进行平叫,则AKeyError会被加注( GH 18303.unstack()SeriesDataFrameIndex

  • Bug在传递kwarg时merge_asof()无法合并Timedelta对象( GH 27642tolerance

  • 当设置为且不是 时DataFrame.crosstab(),会引发错误。 (GH 27500marginsTruenormalizeFalse

  • DataFrame.join()现在FutureWarning指定排序参数时会抑制 ( GH 21952 )

  • DataFrame.join()使用只读数组引发错误( GH 27943

稀疏#

  • Series稀疏 dtypes的减少错误( GH 27080 )

其他

  • Series.replace()使用类似字典的替换器替换时DataFrame.replace()区感知时间戳时出现错误( GH 27720

  • Series.rename()使用自定义类型索引器时出现错误。现在,任何不可调用或类似字典的值都被视为标量。 (GH 27814

贡献者#

共有 5 人为此版本贡献了补丁。名字带有“+”的人首次贡献了补丁。

  • 杰夫·雷巴克

  • 乔里斯·范登博什

  • Meeseeks机器 +

  • 汤姆·奥格斯普格

  • 杰布罗克门德尔