pandas.core.groupby.SeriesGroupBy.mean #
- 系列分组依据。意思(numeric_only = False, engine = None, engine_kwargs = None)[来源] #
计算组的平均值,排除缺失值。
- 参数:
- numeric_only布尔值,默认 False
仅包含 float、int、boolean 列。
版本 2.0.0 中更改: numeric_only 不再接受
None
并默认为False
.- 引擎str,默认无
'cython'
:通过 cython 的 C 扩展运行操作。'numba'
:通过 numba 的 JIT 编译代码运行操作。None
:默认'cython'
或全局设置compute.use_numba
1.4.0 版本中的新增功能。
- engine_kwargs字典,默认 None
对于
'cython'
发动机,没有可接受的engine_kwargs
对于
'numba'
引擎,引擎可以接受nopython
,nogil
和parallel
字典键。这些值必须是True
或False
。引擎engine_kwargs
的默认值'numba'
是{{'nopython': True, 'nogil': False, 'parallel': False}}
1.4.0 版本中的新增功能。
- 返回:
- pandas.Series 或 pandas.DataFrame
也可以看看
Series.groupby
将函数 groupby 应用于系列。
DataFrame.groupby
将函数 groupby 应用于 DataFrame 的每一行或每一列。
例子
>>> df = pd.DataFrame({'A': [1, 1, 2, 1, 2], ... 'B': [np.nan, 2, 3, 4, 5], ... 'C': [1, 2, 1, 1, 2]}, columns=['A', 'B', 'C'])
按一列分组并返回每组中剩余列的平均值。
>>> df.groupby('A').mean() B C A 1 3.0 1.333333 2 4.0 1.500000
对两列进行分组并返回剩余列的平均值。
>>> df.groupby(['A', 'B']).mean() C A B 1 2.0 2.0 4.0 1.0 2 3.0 1.0 5.0 2.0
按一列分组并返回组中仅特定列的平均值。
>>> df.groupby('A')['B'].mean() A 1 3.0 2 4.0 Name: B, dtype: float64