通过...分组

pandas.api.typing.DataFrameGroupBy和实例分别由 groupby 调用和 pandas.api.typing.SeriesGroupBy 返回。pandas.DataFrame.groupby()pandas.Series.groupby()

索引、迭代#

DataFrameGroupBy.__iter__()

Groupby 迭代器。

SeriesGroupBy.__iter__()

Groupby 迭代器。

DataFrameGroupBy.groups

字典 {组名称 -> 组标签}。

SeriesGroupBy.groups

字典 {组名称 -> 组标签}。

DataFrameGroupBy.indices

字典 {组名称 -> 组索引}。

SeriesGroupBy.indices

字典 {组名称 -> 组索引}。

DataFrameGroupBy.get_group(名称[,对象])

从具有提供名称的组构造 DataFrame。

SeriesGroupBy.get_group(名称[,对象])

从具有提供名称的组构造 DataFrame。

Grouper(*args, **kwargs)

Grouper 允许用户为对象指定 groupby 指令。

函数应用助手#

NamedAgg(列,aggfunc)

用于特定于列的聚合的帮助器,可控制输出列名称。

功能应用#

SeriesGroupBy.apply(func, *args, **kwargs)

逐组应用函数func并将结果组合在一起。

DataFrameGroupBy.apply(func, *args[, ...])

逐组应用函数func并将结果组合在一起。

SeriesGroupBy.agg([功能,引擎,engine_kwargs])

使用指定轴上的一项或多项操作进行聚合。

DataFrameGroupBy.agg([功能、引擎、...])

使用指定轴上的一项或多项操作进行聚合。

SeriesGroupBy.aggregate([功能、引擎、...])

使用指定轴上的一项或多项操作进行聚合。

DataFrameGroupBy.aggregate([功能、引擎、...])

使用指定轴上的一项或多项操作进行聚合。

SeriesGroupBy.transform(func, *args[, ...])

调用函数在每个组上生成相同索引的系列。

DataFrameGroupBy.transform(func, *args[, ...])

调用函数在每个组上生成相同索引的 DataFrame。

SeriesGroupBy.pipe(func, *args, **kwargs)

func带有参数的对象应用于此 GroupBy 对象并返回其结果。

DataFrameGroupBy.pipe(func, *args, **kwargs)

func带有参数的对象应用于此 GroupBy 对象并返回其结果。

DataFrameGroupBy.filter(func[, dropna])

从不满足条件的组中过滤元素。

SeriesGroupBy.filter(func[, dropna])

从不满足条件的组中过滤元素。

DataFrameGroupBy计算/描述性统计#

DataFrameGroupBy.all([跳过])

如果组中的所有值都是真实的,则返回 True,否则返回 False。

DataFrameGroupBy.any([跳过])

如果组中的任何值是真实的,则返回 True,否则返回 False。

DataFrameGroupBy.bfill([限制])

向后填充值。

DataFrameGroupBy.corr([方法, min_periods, ...])

计算列的成对相关性,不包括 NA/null 值。

DataFrameGroupBy.corrwith(其他[,轴,...])

计算成对相关性。

DataFrameGroupBy.count()

计算组的计数,排除缺失值。

DataFrameGroupBy.cov([min_periods, ddof, ...])

计算列的成对协方差,不包括 NA/null 值。

DataFrameGroupBy.cumcount([上升])

从 0 到该组的长度 - 1 对每组中的每个项目进行编号。

DataFrameGroupBy.cummax([轴,仅数字])

每组的累计最大值。

DataFrameGroupBy.cummin([轴,仅数字])

每组的累计最小值。

DataFrameGroupBy.cumprod([轴])

每组的累积乘积。

DataFrameGroupBy.cumsum([轴])

每组的累计总和。

DataFrameGroupBy.describe([百分位数,...])

生成描述性统计数据。

DataFrameGroupBy.diff([周期、轴])

元素的第一个离散差分。

DataFrameGroupBy.ffill([限制])

向前填充值。

DataFrameGroupBy.fillna([值、方法、...])

(已弃用)使用组内指定的方法填充 NA/NaN 值。

DataFrameGroupBy.first([仅限数字,...])

计算每组中每列的第一个条目。

DataFrameGroupBy.head([n])

返回每组的前 n 行。

DataFrameGroupBy.idxmax([轴、skipna、...])

返回请求轴上第一次出现最大值的索引。

DataFrameGroupBy.idxmin([轴、skipna、...])

返回请求轴上第一次出现最小值的索引。

DataFrameGroupBy.last([仅限数字,...])

计算每组中每列的最后一个条目。

DataFrameGroupBy.max([仅限数字,...])

计算组值的最大值。

DataFrameGroupBy.mean([仅限数字,...])

计算组的平均值,排除缺失值。

DataFrameGroupBy.median([仅限数字])

计算组的中位数,排除缺失值。

DataFrameGroupBy.min([仅限数字,...])

计算组值的最小值。

DataFrameGroupBy.ngroup([上升])

对每个组进行从 0 到组数 - 1 的编号。

DataFrameGroupBy.nth

如果 n 是 int,则取每组中的第 n 行,否则取行的子集。

DataFrameGroupBy.nunique([滴那])

返回 DataFrame,其中包含每个位置中唯一元素的计数。

DataFrameGroupBy.ohlc()

计算一组的开盘价、最高价、最低价和收盘价,排除缺失值。

DataFrameGroupBy.pct_change([句号,...])

计算组中每个值相对于前一个条目的 pct_change。

DataFrameGroupBy.prod([仅数字,最小计数])

计算组值的乘积。

DataFrameGroupBy.quantile([q, ...])

返回给定分位数的组值,即 numpy.percentile。

DataFrameGroupBy.rank([方法,升序,...])

提供每组内值的排名。

DataFrameGroupBy.resample(规则,*args[,...])

使用 TimeGrouper 时提供重采样。

DataFrameGroupBy.rolling(*args, **kwargs)

返回滚动石斑鱼,为每组提供滚动功能。

DataFrameGroupBy.sample([n、压裂、替换、...])

返回每组中项目的随机样本。

DataFrameGroupBy.sem([ddof,仅限数字])

计算组平均值的标准误差,不包括缺失值。

DataFrameGroupBy.shift([周期、频率、...])

按周期观察移动每组。

DataFrameGroupBy.size()

计算组大小。

DataFrameGroupBy.skew([轴、skipna、...])

返回组内的无偏斜。

DataFrameGroupBy.std([ddof、引擎、...])

计算组的标准差,排除缺失值。

DataFrameGroupBy.sum([仅限数字,...])

计算组值的总和。

DataFrameGroupBy.var([ddof、引擎、...])

计算组的方差,排除缺失值。

DataFrameGroupBy.tail([n])

返回每组的最后 n 行。

DataFrameGroupBy.take(索引[,轴])

返回每组中给定位置索引中的元素。

DataFrameGroupBy.value_counts([子集,...])

返回包含唯一行数的 Series 或 DataFrame。

SeriesGroupBy计算/描述性统计#

SeriesGroupBy.all([跳过])

如果组中的所有值都是真实的,则返回 True,否则返回 False。

SeriesGroupBy.any([跳过])

如果组中的任何值是真实的,则返回 True,否则返回 False。

SeriesGroupBy.bfill([限制])

向后填充值。

SeriesGroupBy.corr(其他[,方法,min_periods])

计算与其他系列的相关性,排除缺失值。

SeriesGroupBy.count()

计算组的计数,排除缺失值。

SeriesGroupBy.cov(其他[, min_periods, ddof])

计算系列的协方差,排除缺失值。

SeriesGroupBy.cumcount([上升])

从 0 到该组的长度 - 1 对每组中的每个项目进行编号。

SeriesGroupBy.cummax([轴,仅数字])

每组的累计最大值。

SeriesGroupBy.cummin([轴,仅数字])

每组的累计最小值。

SeriesGroupBy.cumprod([轴])

每组的累积乘积。

SeriesGroupBy.cumsum([轴])

每组的累计总和。

SeriesGroupBy.describe([百分位数,...])

生成描述性统计数据。

SeriesGroupBy.diff([周期、轴])

元素的第一个离散差分。

SeriesGroupBy.ffill([限制])

向前填充值。

SeriesGroupBy.fillna([值、方法、轴、...])

(已弃用)使用组内指定的方法填充 NA/NaN 值。

SeriesGroupBy.first([仅限数字,...])

计算每组中每列的第一个条目。

SeriesGroupBy.head([n])

返回每组的前 n 行。

SeriesGroupBy.last([仅限数字,...])

计算每组中每列的最后一个条目。

SeriesGroupBy.idxmax([轴,跳过])

返回最大值的行标签。

SeriesGroupBy.idxmin([轴,跳过])

返回最小值的行标签。

SeriesGroupBy.is_monotonic_increasing

返回每个组的值是否单调递增。

SeriesGroupBy.is_monotonic_decreasing

返回每个组的值是否单调递减。

SeriesGroupBy.max([仅数字,最小计数,...])

计算组值的最大值。

SeriesGroupBy.mean([仅限数字,引擎,...])

计算组的平均值,排除缺失值。

SeriesGroupBy.median([仅限数字])

计算组的中位数,排除缺失值。

SeriesGroupBy.min([仅数字,最小计数,...])

计算组值的最小值。

SeriesGroupBy.ngroup([上升])

对每个组进行从 0 到组数 - 1 的编号。

SeriesGroupBy.nlargest([n,保留])

返回最大的n 个元素。

SeriesGroupBy.nsmallest([n,保留])

返回最小的n 个元素。

SeriesGroupBy.nth

如果 n 是 int,则取每组中的第 n 行,否则取行的子集。

SeriesGroupBy.nunique([滴那])

返回组中唯一元素的数量。

SeriesGroupBy.unique()

返回每个组的唯一值。

SeriesGroupBy.ohlc()

计算一组的开盘价、最高价、最低价和收盘价,排除缺失值。

SeriesGroupBy.pct_change([句号,...])

计算组中每个值相对于前一个条目的 pct_change。

SeriesGroupBy.prod([仅数字,最小计数])

计算组值的乘积。

SeriesGroupBy.quantile([q, 插值, ...])

返回给定分位数的组值,即 numpy.percentile。

SeriesGroupBy.rank([方法,升序,...])

提供每组内值的排名。

SeriesGroupBy.resample(规则,*args[,...])

使用 TimeGrouper 时提供重采样。

SeriesGroupBy.rolling(*args, **kwargs)

返回滚动石斑鱼,为每组提供滚动功能。

SeriesGroupBy.sample([n、压裂、替换、...])

返回每组中项目的随机样本。

SeriesGroupBy.sem([ddof,仅限数字])

计算组平均值的标准误差,不包括缺失值。

SeriesGroupBy.shift([周期、频率、轴、...])

按周期观察移动每组。

SeriesGroupBy.size()

计算组大小。

SeriesGroupBy.skew([轴,skipna,仅限数字])

返回组内的无偏斜。

SeriesGroupBy.std([ddof、引擎、...])

计算组的标准差,排除缺失值。

SeriesGroupBy.sum([仅数字,最小计数,...])

计算组值的总和。

SeriesGroupBy.var([ddof、引擎、...])

计算组的方差,排除缺失值。

SeriesGroupBy.tail([n])

返回每组的最后 n 行。

SeriesGroupBy.take(索引[,轴])

返回每组中给定位置索引中的元素。

SeriesGroupBy.value_counts([标准化,...])

绘图和可视化#

DataFrameGroupBy.boxplot([子图、专栏、...])

根据 DataFrameGroupBy 数据制作箱线图。

DataFrameGroupBy.hist([列、按、网格、...])

制作 DataFrame 列的直方图。

SeriesGroupBy.hist([按、斧头、网格、...])

使用 matplotlib 绘制输入序列的直方图。

DataFrameGroupBy.plot

绘制系列或数据框的图。

SeriesGroupBy.plot

绘制系列或数据框的图。