版本 0.20.2(2017 年 6 月 4 日)#

这是 0.20.x 系列中的一个小错误修复版本,包括一些小的回归修复、错误修复和性能改进。我们建议所有用户升级到此版本。

增强功能#

  • 畅通无阻地访问 pytables 支持的其他压缩类型:'blosc:blosclz、'blosc:lz4'、'blosc:lz4hc'、'blosc:snappy'、'blosc:zlib'、'blosc:zstd' ( GH 14478 )

  • Series提供了一种to_latex方法(GH 16180

  • 添加了GroupBy.ngroup()与现有方法并行的新 groupby 方法来返回组顺序( GH 11642);看 这里GroupBy.cumcount()

性能改进#

  • 使用类似列表进行索引时的性能回归修复(GH 16285

  • 多索引的性能回归修复(GH 16319GH 16346

  • .clip()改进了标量参数的性能( GH 15400

  • 使用分类石斑鱼改进了 groupby 的性能(GH 16413

  • 改进的性能MultiIndex.remove_unused_levels()( GH 16556 )

Bug修复

  • 在某些 Windows 环境中检测终端大小时,消除了有关“tput:终端属性:无此类设备或地址”的警告。此修复仅适用于 python 3 ( GH 16496 )

  • 使用pathlib.Pathpy.path.local具有 io 函数的对象时出现错误(GH 16291

  • 两个相等的 MultiIndex 上的错误Index.symmetric_difference(),导致TypeError( GH 13490 )

  • 错误DataFrame.update()overwrite=False和(GH 15593NaN values

  • 现在传递一个无效的引擎read_csv()会引发一个信息性的问题, ValueError而不是UnboundLocalError. (GH 16511

  • unique()元组数组中的错误( GH 16519

  • cut()设置时出现错误labels,导致标签排序不正确(GH 16459

  • 修复了 IPython 6.0 的制表符补全的兼容性问题,显示弃用警告Categoricals( GH 16409 )

转换

  • to_numeric()空数据输入导致解释器出现段错误的错误( GH 16302

  • 使用比较操作广播时静音 numpy 警告(DataFrameGH 16378 GH 16306Series

索引#

  • DataFrame.reset_index(level=)单级索引错误( GH 16263

  • 使用单调但非严格单调的部分字符串索引中的错误,索引错误地反转了切片边界(GH 16515

  • 错误在于MultiIndex.remove_unused_levels()不会返回MultiIndex等于原始值的值。 (GH 16556

IO #

  • read_csv()comment在空格分隔的文本文件中传递时出现错误( GH 16472

  • 当列的长度正确时,不read_csv()引发异常的错误( GH 14671usecols

  • 错误会强制导入不必要的剪贴板例程,可能会导致启动时出现导入错误(GH 16288

  • IndexErrorHTML 渲染空时引发的错误DataFrame( GH 15953 )

  • read_csv()Tarfile 对象输入在 C 引擎的 Python 2.x 中引发错误的错误 ( GH 16530 )

  • DataFrame.to_html()忽略参数的错误index_namesGH 16493

  • Bug wherepd.read_hdf()返回索引名称的 numpy 字符串 ( GH 13492 )

  • HDFStore.select_as_multiple()不尊重开始/停止参数的错误( GH 16209

绘图#

  • DataFrame.plot使用单列和类似列表的错误colorGH 3486

  • plot结果NaT中的DatetimeIndex错误(Timestamp.minGH 12405

  • 对于非分组箱线图,不尊重DataFrame.boxplotwhere关键字的错误( GH 11959figsize

GroupBy/重新采样/滚动#

  • 在空对象上创建基于时间的滚动窗口时出现错误DataFrameGH 15819

  • rolling.cov()偏移窗口中的错误( GH 16058

  • 聚合整数时的.resample()错误(GH 16361.groupby()

稀疏#

  • SparseDataFramefrom的构造错误scipy.sparse.dok_matrix( GH 16179 )

重塑#

  • DataFrame.stack列中未排序级别的错误MultiIndexGH 16323

  • 当不是唯一标识符pd.wide_to_long()时没有引发错误的错误( GH 16382i

  • 错误地Series.isin(..)使用元组列表(GH 16394

  • 构建DataFrame具有混合数据类型(包括全 NaT 列)的错误。 (GH 16395

  • DataFrame.agg()聚合Series.agg()不可调用属性中的错误( GH 16405

数字#

  • 错误.interpolate(),当(默认)通过limit_direction时没有考虑到哪里( GH 16282limit=None

分类#

  • 当两个类别均无序时,考虑类别顺序的固定比较操作(GH 16014

其他

  • 错误包含DataFrame.drop()具有非唯一索引的空列表(GH 16270

贡献者#

共有 34 人为此版本贡献了补丁。名字带有“+”的人首次贡献了补丁。

  • 亚伦·巴伯 +

  • 安德鲁亮 +

  • 贝基·斯威格 +

  • 克里斯蒂安·普林诺斯 +

  • 克里斯蒂安·施塔德-舒尔特 +

  • 帝斯曼

  • 埃里克·弗雷德里克森 +

  • 于格斯·瓦卢瓦 +

  • 杰夫·雷巴克

  • 杰夫·特拉特纳

  • 吉姆·斯特恩斯206 +

  • 约翰·W·奥布莱恩

  • 乔里斯·范登博什

  • 约瑟夫·瓦格纳 +

  • 基思·韦伯 +

  • 穆罕默德·阿里·“马里”·阿克马纳尔普 +

  • 潘卡·潘迪

  • 罗帕特里克+

  • 帕特里克·奥迈斯 +

  • 彼得罗·巴蒂斯顿

  • 罗宾五字+

  • 瑞安·亨德里克森 +

  • 西蒙·巴伦 +

  • 汤姆·奥格斯普格

  • 裸+

  • 布普拉加斯蒂斯 +

  • 切恩里克+

  • 克里斯-B1

  • 经济+

  • 格菲扬

  • 贾里德斯奈德 +

  • 庆栗田 +

  • 线BP

  • 劳埃德柯克 +