pandas.DataFrame.gt #

数据框。gt ( other , axis = 'columns' , level = None ) [来源] #

获取大于数据帧和其他元素的数据(二元运算符gt)。

灵活的包装器(eqneleltgegt)到比较运算符。

相当于== , != , <= , < , >= , >支持选择轴(行或列)和级别进行比较。

参数
其他标量、序列、系列或数据帧

任何单个或多个元素的数据结构,或类似列表的对象。

{0 或 'index', 1 或 'columns'}, 默认 'columns'

是否按索引(0 或“索引”)或列(1 或“列”)进行比较。

level int 或 label

跨级别广播,匹配传递的多索引级别上的索引值。

返回
bool 数据框

比较结果。

也可以看看

DataFrame.eq

按元素比较 DataFrame 是否相等。

DataFrame.ne

按元素比较 DataFrame 的不等式。

DataFrame.le

按元素比较 DataFrame 是否小于不等式或等式。

DataFrame.lt

按元素比较 DataFrame 是否严格小于不等式。

DataFrame.ge

按元素比较 DataFrame 是否大于不等或相等。

DataFrame.gt

比较数据帧是否严格大于不等式元素。

笔记

不匹配的索引将合并在一起。 NaN值被认为是不同的(即NaN != NaN)。

例子

>>> df = pd.DataFrame({'cost': [250, 150, 100],
...                    'revenue': [100, 250, 300]},
...                   index=['A', 'B', 'C'])
>>> df
   cost  revenue
A   250      100
B   150      250
C   100      300

使用运算符或方法与标量进行比较:

>>> df == 100
    cost  revenue
A  False     True
B  False    False
C   True    False
>>> df.eq(100)
    cost  revenue
A  False     True
B  False    False
C   True    False

other是 a时,DataFrame 的列与otherSeries的索引对齐并广播:

>>> df != pd.Series([100, 250], index=["cost", "revenue"])
    cost  revenue
A   True     True
B   True    False
C  False     True

使用方法控制广播轴:

>>> df.ne(pd.Series([100, 300], index=["A", "D"]), axis='index')
   cost  revenue
A  True    False
B  True     True
C  True     True
D  True     True

与任意序列进行比较时,列数必须与other中的元素数匹配:

>>> df == [250, 100]
    cost  revenue
A   True     True
B  False    False
C  False    False

使用方法控制轴:

>>> df.eq([250, 250, 100], axis='index')
    cost  revenue
A   True    False
B  False     True
C   True    False

与不同形状的 DataFrame 进行比较。

>>> other = pd.DataFrame({'revenue': [300, 250, 100, 150]},
...                      index=['A', 'B', 'C', 'D'])
>>> other
   revenue
A      300
B      250
C      100
D      150
>>> df.gt(other)
    cost  revenue
A  False    False
B  False    False
C  False     True
D  False    False

按级别与 MultiIndex 进行比较。

>>> df_multindex = pd.DataFrame({'cost': [250, 150, 100, 150, 300, 220],
...                              'revenue': [100, 250, 300, 200, 175, 225]},
...                             index=[['Q1', 'Q1', 'Q1', 'Q2', 'Q2', 'Q2'],
...                                    ['A', 'B', 'C', 'A', 'B', 'C']])
>>> df_multindex
      cost  revenue
Q1 A   250      100
   B   150      250
   C   100      300
Q2 A   150      200
   B   300      175
   C   220      225
>>> df.le(df_multindex, level=1)
       cost  revenue
Q1 A   True     True
   B   True     True
   C   True     True
Q2 A  False     True
   B   True    False
   C   True    False