版本 0.9.0(2012 年 10 月 7 日)# 这是 0.8.1 的主要版本,包含多项新功能和增强功能以及大量错误修复。新功能包括矢量化 unicode 编码/解码Series.str、to_latexDataFrame 方法、更灵活的布尔值解析,以及支持从 Yahoo! 下载选项数据。金融。 新功能# 将encode和decode用于 unicode 处理添加到Series.str 中的矢量化字符串处理方法( GH 1706) 添加DataFrame.to_latex方法(GH 1735) 添加所有rolling_*操作的方便扩展窗口等效项(GH 1785) 将 Options 类添加到 pandas.io.data 以从 Yahoo! 获取选项数据金融 ( GH 1748 , GH 1739 ) 更灵活地解析布尔值(Yes、No、TRUE、FALSE 等)(GH 1691、GH 1295) 添加level参数到Series.reset_index TimeSeries.between_time现在可以选择午夜的时间(GH 1871) 系列构造函数现在可以将生成器作为输入处理(GH 1679) DataFrame.dropna现在可以采用多个轴(元组/列表)作为输入(GH 924) 启用( GH 1843 )skip_footer中的参数ExcelFile.parse API 更改# header=None当和没有传递给函数时的默认列名称read_csv已更改为更加 Pythonic 且易于属性访问: In [1]: import io In [2]: data = """ ...: 0,0,1 ...: 1,1,0 ...: 0,1,0 ...: """ ...: In [3]: df = pd.read_csv(io.StringIO(data), header=None) In [4]: df Out[4]: 0 1 2 0 0 0 1 1 1 1 0 2 0 1 0 从另一个系列创建一个系列,传递索引,将导致内部发生重新索引,而不是将系列视为 ndarray。在某些情况下,技术上不正确的使用(例如之前“意外”(这从来不是故意的))将导致所有 NA 系列。完全清楚地说:Series(df[col1], index=df[col2]) In [5]: s1 = pd.Series([1, 2, 3]) In [6]: s1 Out[6]: 0 1 1 2 2 3 dtype: int64 In [7]: s2 = pd.Series(s1, index=["foo", "bar", "baz"]) In [8]: s2 Out[8]: foo NaN bar NaN baz NaN dtype: float64 已弃用的day_of_yearAPI 从 periodIndex 中删除,请使用dayofyear ( GH 1723 ) 不要在导入时将 NumPy 抑制打印选项修改为 True DataFrame 的内部 HDF5 数据排列已被转置。 HDFStore 仍可读取旧文件(GH 1834、GH 1824) 删除旧版内容:pandas.stats.misc.quantileTS 使用 ISO8601 格式进行周期重复:每月、每日和向下 ( GH 1776 ) 空 DataFrame 列现在创建为对象数据类型。这将防止在代码中发生一类 TypeErrors,其中列的 dtype 取决于数据是否存在(例如,具有结果的 SQL 查询)(GH 1783) 使用 ix 设置 DataFrame/Panel 的部分现在可以对齐输入 Series/DataFrame ( GH 1630 ) first和last方法GroupBy不再删除非数字列(GH 1809) 解决了在文本解析器中指定自定义 NA 值时出现的不一致问题。 na_values类型 dict 不再覆盖默认 NA,除非 keep_default_na显式设置为 false ( GH 1657 ) DataFrame.dot不会进行数据对齐,也可以与系列一起使用(GH 1915) 请参阅GitHub 上的完整发行说明或问题跟踪器以获取完整列表。 贡献者# 共有 24 人为此版本贡献了补丁。名字带有“+”的人首次贡献了补丁。 常社 克里斯托弗·惠兰 + 丹·米勒 + 丹尼尔·夏皮罗 + 迪特·范登布斯切 道格·科尔曼 + 约翰·科尔文 + 约翰尼+ 约书亚·莱希 + 拉尔斯·布廷克 + 马克·奥利里 + 马丁·布莱斯 敏RK+ 保罗·伊万诺夫 + 船长西博尔德 斯宾塞·里昂 + 塔维·伯恩斯 + 韦斯·麦金尼 沃特·奥弗迈尔 雅罗斯拉夫·哈尔琴科 勒诺利布+ 查克+ yp + Øystein S.哈兰德 +