0.25.1 的新增内容(2019 年 8 月 21 日)# 这些是 pandas 0.25.1 中的更改。请参阅发行说明以获取完整的变更日志,包括其他版本的 pandas。 IO 和 LZMA # 一些用户可能在不知情的情况下安装了不完整的 Python,缺少lzma标准库中的模块。在本例中,由于( GH 27575 ) 而失败。如果模块不存在,pandas 现在会发出警告,而不是引发。任何后续尝试使用方法都会引发.解决缺少模块的可能方法是确保您拥有必要的库,然后重新安装 Python。例如,在 MacOS 上安装 Python可能会由于编译时未满足系统依赖关系而导致 Python 安装不完整(如)。编译会成功,但 Python 在运行时可能会失败。该问题可以通过安装必要的依赖项然后重新安装Python来解决。import pandasImportErrorImportErrorlzmalzmaRuntimeErrorlzmapyenvxz Bug修复# 分类# 错误Categorical.fillna()将替换所有值,而不仅仅是那些NaN(GH 26215) 类似日期时间# to_datetime()传递时区朴素DatetimeArray或DatetimeIndexandutc=True会错误地返回时区朴素结果的错误( GH 27733) 在实现Period.to_timestamp()范围Period之外Timestamp(大约 1677-09-21 到 2262-04-11)将返回错误Timestamp而不是引发的错误OutOfBoundsDatetime(GH 19643) DatetimeIndex当底层数据为只读时迭代出现错误( GH 28055 ) 时区# Index具有时区感知功能的 numpy 对象数组Timestamp不会np.nan返回DatetimeIndex( GH 27011 )的错误 数字# Series.interpolate()使用时区感知时出现错误DatetimeIndex(GH 27548) 打印负浮点复数时的错误会引发IndexError( GH 27484 ) 算术运算符DataFrame(例如DataFrame.mul()带有 axis=1 的 a Series)会引发AttributeError大于DataFrame调用 numexpr 的最小阈值的错误(GH 27636) 算术中的错误DataFrame,其中结果中的缺失值被错误地掩盖,NaN而不是Inf(GH 27464) 转换# 改进了已弃用方法的警告Series.real()和Series.imag()(GH 27610) 间隔# IntervalIndex哪里dir(obj)会引发错误ValueError(GH 27571) 索引# Series使用标量.loc['2015'](GH 27516)进行索引时,部分字符串索引返回 NumPy 数组而不是 a 的错误 打破涉及Index其他索引类的引用循环,以允许在不运行 GC 的情况下对索引对象进行垃圾回收。 (GH 27585,GH 27840) 修复将值分配给具有列的 DataFrame 的单列时的回归MultiIndex( GH 27841 )。 .ix使用IntervalIndex( GH 27865 )修复回退中的回归。 丢失的# 当输入是一种类型时pandas.isnull()出现错误,例如(GH 27482)pandas.isna()type(pandas.Series()) IO # 读取 parquet 时避免调用S3File.s3,因为这在 s3fs 版本 0.3.0 中已删除(GH 27756) 传入负标头时出现更好的错误消息pandas.read_csv()( GH 27779 ) 正确遵循min_rows笔记本 ( GH 27991 ) 中 HTML 表示中的显示选项(在 v0.25.0 中引入)。 绘图# 添加了pandas_plotting_backends用于注册绘图后端的入口点组。有关更多信息,请参阅绘制后端( GH 26747 )。 修复了调用后重新设置 Matplotlib 日期时间转换器的问题 pandas.plotting.deregister_matplotlib_converters()( GH 27481 )。 修复将 pandas 传递Index给绘图调用时与 matplotlib 的兼容性问题 ( GH 27775 )。 GroupBy/重新采样/滚动# pands.core.groupby.DataFrameGroupBy.quantile()修复了给出多个分位数时提升的回归( GH 27526) DataFrameGroupBy.transform()应用时区转换 lambda 函数会删除时区信息的错误( GH 27496 ) 分类石斑鱼被忽略的GroupBy.nth()错误(GH 26385)observed=False 只读数组上的窗口错误 ( GH 27766 ) 修复了.DataFrameGroupBy.quantile传递无效分位数时的段错误(GH 27470) 重塑# 现在,如果在 a 上跟注或使用不正确的名称进行平叫,则AKeyError会被加注( GH 18303).unstack()SeriesDataFrameIndex Bug在传递kwarg时merge_asof()无法合并Timedelta对象( GH 27642)tolerance 当设置为且不是 时DataFrame.crosstab(),会引发错误。 (GH 27500)marginsTruenormalizeFalse DataFrame.join()现在FutureWarning指定排序参数时会抑制 ( GH 21952 ) DataFrame.join()使用只读数组引发错误( GH 27943) 稀疏# Series稀疏 dtypes的减少错误( GH 27080 ) 其他# Series.replace()使用类似字典的替换器替换时DataFrame.replace()区感知时间戳时出现错误( GH 27720) Series.rename()使用自定义类型索引器时出现错误。现在,任何不可调用或类似字典的值都被视为标量。 (GH 27814) 贡献者# 共有 5 人为此版本贡献了补丁。名字带有“+”的人首次贡献了补丁。 杰夫·雷巴克 乔里斯·范登博什 Meeseeks机器 + 汤姆·奥格斯普格 杰布罗克门德尔