pandas.core.window.expanding.Expanding.corr #

扩大。corr ( other = None , pairwise = None , ddof = 1 , numeric_only = False ) [来源] #

计算扩展相关性。

参数
其他系列或数据框,可选

如果未提供,则将默认为 self 并产生成对输出。

成对布尔值,默认无

如果为 False,则仅使用 self 和 other 之间的匹配列,并且输出将是一个 DataFrame。如果为 True,则将计算所有成对组合,并且在 DataFrame 输入的情况下,输出将是 MultiIndexed DataFrame。在缺少元素的情况下,仅使用完整的成对观测值。

numeric_only布尔值,默认 False

仅包含 float、int、boolean 列。

1.5.0 版本中的新增内容。

返回
系列或数据框

返回类型与具有 dtype 的原始对象相同np.float64

也可以看看

cov

计算协方差的方法类似。

numpy.corrcoef

NumPy Pearson 的相关性计算。

pandas.Series.expanding

调用扩展系列数据。

pandas.DataFrame.expanding

使用 DataFrame 调用扩展。

pandas.Series.corr

聚合系列的相关性。

pandas.DataFrame.corr

聚合 DataFrame 的 corr。

笔记

该函数使用 Pearson 的相关性定义 ( https://en.wikipedia.org/wiki/Pearson_correlation_coefficient )。

当未指定other时,输出将是自相关的(例如全 1),除了成对 设置为True 的DataFrame输入。

函数将返回NaN等值序列的相关性;这是 0/0 除法错误的结果。

pairwise设置为False时,仅使用selfother之间的匹配列。

pairwise设置为True时,输出将是一个 MultiIndex DataFrame,其中原始索引位于第一级,其他DataFrame列位于第二级。

在缺少元素的情况下,仅使用完整的成对观测值。

例子

>>> ser1 = pd.Series([1, 2, 3, 4], index=['a', 'b', 'c', 'd'])
>>> ser2 = pd.Series([10, 11, 13, 16], index=['a', 'b', 'c', 'd'])
>>> ser1.expanding().corr(ser2)
a         NaN
b    1.000000
c    0.981981
d    0.975900
dtype: float64