1.5.1 的新增内容(2022 年 10 月 19 日)#

这些是 pandas 1.5.1 中的变化。请参阅发行说明以获取完整的变更日志,包括其他版本的 pandas。

groupby分类石斑鱼的行为( GH 48645 ) #

在 1.5 之前的 pandas 版本中,当石斑鱼是分类 dtype 时,groupbywith仍然会删除 NA 值。 dropna=False1.5 中尝试对此进行修复,但是它引入了回归,其中传递observed=Falsedropna=Falsetogroupby只会导致观察到的类别。我们发现修复该dropna=False错误的补丁与 不兼容observed=False,并决定最好的解决方案是以observed=False 重新引入该错误为代价来恢复正确的行为dropna=False

In [1]: df = pd.DataFrame(
   ...:     {
   ...:         "x": pd.Categorical([1, None], categories=[1, 2, 3]),
   ...:         "y": [3, 4],
   ...:     }
   ...: )
   ...: 

In [2]: df
Out[2]: 
     x  y
0    1  3
1  NaN  4

1.5.0行为

In [3]: # Correct behavior, NA values are not dropped
        df.groupby("x", observed=True, dropna=False).sum()
Out[3]:
     y
x
1    3
NaN  4


In [4]: # Incorrect behavior, only observed categories present
        df.groupby("x", observed=False, dropna=False).sum()
Out[4]:
     y
x
1    3
NaN  4

1.5.1 行为

# Incorrect behavior, NA values are dropped
In [3]: df.groupby("x", observed=True, dropna=False).sum()
Out[3]: 
     y
x     
1    3
NaN  4

# Correct behavior, unobserved categories present (NA values still dropped)
In [4]: df.groupby("x", observed=False, dropna=False).sum()
Out[4]: 
     y
x     
1    3
2    0
3    0
NaN  4

固定回归#

Bug修复

其他

  • 内省函数时避免显示已弃用的签名,并发出有关参数变为仅关键字的警告(GH 48692

贡献者#

共有 16 人为此版本贡献了补丁。名字带有“+”的人首次贡献了补丁。

  • 阿梅·帕特尔 +

  • 迪帕克·西罗希瓦尔 +

  • 丹尼斯·查昆塔

  • 高拉夫·谢尼

  • 希曼舒·瓦格 +

  • 洛伦佐·瓦尼利 +

  • 马克·加西亚

  • 马可·爱德华·戈雷利

  • 马修·罗斯克

  • 米塞克斯机器

  • 诺亚·塔米尔

  • 熊猫开发团队

  • 帕特里克·赫夫勒

  • 理查德·沙德拉赫

  • 尚塔努

  • 托斯顿·沃特温