2.2.1 中的新增内容(2024 年 2 月 22 日)# 这些是 pandas 2.2.1 中的变化。请参阅发行说明以获取完整的变更日志,包括其他版本的 pandas。 增强功能# 添加了pyarrowpip extra,以便用户可以使用 pip 安装 pandas 和 pyarrow ( GH 54466 )pip install pandas[pyarrow] 固定回归# 修复了内存泄漏read_csv()(GH 57039) Series.combine_first()修复了( GH 55845 )中的性能回归 修复了导致接近最小时间戳溢出的回归(GH 57150) concat()修复了改变长期行为中的回归,当轴为 a DatetimeIndex( GH 57006 )时,该行为始终对非串联轴进行排序 修复了merge_ordered()和TypeError的fill_method="ffill"回归问题how="left"(GH 57010) 修复了检查(GH 57067)时pandas.testing.assert_series_equal()默认的回归check_exact=TrueIndex 修复了返回read_json()anIndex而不是 a 的回归RangeIndex(GH 57429) wide_to_long()修复了引发AttributeErrorfor 字符串列时的回归( GH 57066) DataFrameGroupBy.idxmin()修复了, DataFrameGroupBy.idxmax(),中的回归SeriesGroupBy.idxmin(),SeriesGroupBy.idxmax()忽略skipna参数 ( GH 57040 ) DataFrameGroupBy.idxmin()修复了, DataFrameGroupBy.idxmax(),中的回归SeriesGroupBy.idxmin(),SeriesGroupBy.idxmax()其中包含数据类型的最小值或最大值的值可能会产生不正确的结果 ( GH 57040 ) CategoricalIndex.difference()修复了KeyError当 other 包含 NaN 以外的空值时引发的回归( GH 57318) 修复了在某些情况下按 a 分组时DataFrame.groupby()提升的回归( GH 57276)ValueErrorSeries 修复了非唯一、屏蔽数据类型索引的回归问题DataFrame.loc(),IndexError其中结果超过 10,000 行 ( GH 57027 ) DataFrame.loc()修复了使用部分行索引器和多列扩展时不必要地引发“不兼容的数据类型警告”的回归(请参阅PDEP6)(GH 56503) DataFrame.map()修复了不na_action="ignore"考虑 NumPy 可空和ArrowDtypes(GH 57316)的回归 修复了某些类型的第 3 方扩展数组的DataFrame.merge()提升回归问题( GH 57316 )ValueError DataFrame.query()修复了具有对象 dtype 的所有列的回归NaT(GH 57068) DataFrame.shift()修复了提升AssertionErrorforaxis=1和empty 时的回归DataFrame(GH 57301) DataFrame.sort_index()修复了无法为具有重复项的索引生成稳定排序的回归( GH 57151) DataFrame.to_dict()修复了withorient='list'和 datetime 或 timedelta 类型返回整数的回归( GH 54824) 修复了将可空整数转换为浮点数时的回归问题DataFrame.to_json()(GH 57224) DataFrame.to_sql()修复了何时method="multi"传递且方言类型不是 Oracle 的回归( GH 57310) DataFrame.transpose()修复了可空扩展 dtypes 中没有 F 连续数据的回归,在使用时可能会导致异常 ( GH 57315 ) DataFrame.update()修复了发出有关向下转型的错误警告的回归( GH 57124) DataFrameGroupBy.idxmin()修复了, DataFrameGroupBy.idxmax(),中的回归SeriesGroupBy.idxmin(),SeriesGroupBy.idxmax()忽略skipna参数 ( GH 57040 ) DataFrameGroupBy.idxmin()修复了, DataFrameGroupBy.idxmax(),中的回归SeriesGroupBy.idxmin(),SeriesGroupBy.idxmax()其中包含数据类型的最小值或最大值的值可能会产生不正确的结果 ( GH 57040 ) ExtensionArray.to_numpy()修复了非数字掩码数据类型提升中的回归( GH 56991) 修复了将空索引连接到包含混合 dtype 值的非空索引时Index.join()引发的回归问题( GH 57048 )TypeError 修复了Series.astype()从缺少值的整数转换为字符串数据类型时引入小数的回归(GH 57418) 修复了为空Series.pct_change()提高 a时的回归(GH 57056)ValueErrorSeries Series.to_numpy()修复了当 dtype 为 float 且数据包含 NaN 时的回归( GH 57121) DateOffset修复了将具有毫秒分量的对象添加或减go到datetime64 Index、Series、 或DataFrame( GH 57529 )的回归 Bug修复# pandas.api.interchange.from_dataframe()修复了可空整数引发的错误( GH 55069) pandas.api.interchange.from_dataframe()修复了空输入引发的错误( GH 56700) pandas.api.interchange.from_dataframe()修复了未将列名称转换为字符串的错误( GH 55069) 修复了启用写入时复制时DataFrame.__getitem__()为空的错误( GH 57130)DataFrame 修复了PeriodIndex.asfreq()静默转换不支持作为周期频率的频率而不是引发错误的错误(GH 56945) 其他# 笔记 DeprecationWarning已删除在未安装 PyArrow 的情况下导入 pandas 时引发的问题。做出这个决定是因为警告对于太多用户来说太吵闹,并且收集了大量关于使 PyArrow 成为必需依赖项的决定的反馈。 Pandas 目前正在考虑决定是否应将 PyArrow 添加为 3.0 中的硬依赖项。感兴趣的用户可以关注这里的讨论 。 将参数添加skipna到DataFrameGroupBy.first()、DataFrameGroupBy.last()、SeriesGroupBy.first()和SeriesGroupBy.last();过goskipna=False可以通过 实现,DataFrameGroupBy.nth()但在 pandas 2.0.0 中行为发生了变化(GH 57019) skipna添加了参数Resampler.first(),Resampler.last()(GH 57019) 贡献者# 共有 14 人为此版本贡献了补丁。名字带有“+”的人首次贡献了补丁。 阿尔伯特·维拉诺瓦·德尔·莫拉尔 卢克·曼利 伐木工(又名杰克) 马可·爱德华·戈雷利 马修·罗斯克 娜塔莉亚·莫基耶娃 熊猫开发团队 帕特里克·赫夫勒 理查德·沙德拉克 罗伯特·施密特克 + 塞缪尔·柴 + 托马斯·李 威廉·艾德 依赖机器人[机器人]