pandas.core.groupby.DataFrameGroupBy.mean #

DataFrameGroupBy。意思numeric_only = False engine = None engine_kwargs = None[来源] #

计算组的平均值,排除缺失值。

参数
numeric_only布尔值,默认 False

仅包含 float、int、boolean 列。

版本 2.0.0 中更改: numeric_only 不再接受None并默认为False.

引擎str,默认无
  • 'cython':通过 cython 的 C 扩展运行操作。

  • 'numba':通过 numba 的 JIT 编译代码运行操作。

  • None:默认'cython'或全局设置 compute.use_numba

1.4.0 版本中的新增功能。

engine_kwargs字典,默认 None
  • 对于'cython'发动机,没有可接受的engine_kwargs

  • 对于'numba'引擎,引擎可以接受nopython,nogilparallel字典键。这些值必须是TrueFalse。引擎engine_kwargs的默认值'numba'{{'nopython': True, 'nogil': False, 'parallel': False}}

1.4.0 版本中的新增功能。

返回
pandas.Series 或 pandas.DataFrame

也可以看看

Series.groupby

将函数 groupby 应用于系列。

DataFrame.groupby

将函数 groupby 应用于 DataFrame 的每一行或每一列。

例子

>>> df = pd.DataFrame({'A': [1, 1, 2, 1, 2],
...                    'B': [np.nan, 2, 3, 4, 5],
...                    'C': [1, 2, 1, 1, 2]}, columns=['A', 'B', 'C'])

按一列分组并返回每组中剩余列的平均值。

>>> df.groupby('A').mean()
     B         C
A
1  3.0  1.333333
2  4.0  1.500000

对两列进行分组并返回剩余列的平均值。

>>> df.groupby(['A', 'B']).mean()
         C
A B
1 2.0  2.0
  4.0  1.0
2 3.0  1.0
  5.0  2.0

按一列分组并返回组中仅特定列的平均值。

>>> df.groupby('A')['B'].mean()
A
1    3.0
2    4.0
Name: B, dtype: float64