pandas.DataFrame.plot.scatter #

数据框.plot。分散( x , y , s = None , c = None , ** kwargs ) [来源] #

创建具有不同标记点大小和颜色的散点图。

每个点的坐标由两个数据框列定义,并使用实心圆圈来表示每个点。这种图对于查看两个变量之间的复杂相关性很有用。例如,点可以是自然的二维坐标,例如地图中的经度和纬度,或者一般来说,可以相互绘制的任何一对度量。

参数
x int 或 str

用作每个点的水平坐标的列名称或列位置。

y int 或 str

用作每个点的垂直坐标的列名称或列位置。

s str,标量或类似数组,可选

每个点的大小。可能的值为:

  • 一个字符串,其中包含要用于标记大小的列名称。

  • 单个标量,因此所有点都具有相同的大小。

  • 标量序列,将递归地用于每个点的大小。例如,当传递 [2,14] 时,所有点的大小将要么是 2,要么是 14。

c str、int 或类似数组,可选

每个点的颜色。可能的值为:

  • 按名称、RGB 或 RGBA 代码引用的单一颜色字符串,例如“red”或“#a98d19”。

  • 由名称、RGB 或 RGBA 代码引用的颜色字符串序列,将递归地用于每个点的颜色。例如 ['green','yellow'] 所有点将交替填充为绿色或黄色。

  • 列名称或位置,其值将用于根据颜色图为标记点着色。

**夸格

要传递给 的关键字参数DataFrame.plot()

返回
matplotlib.axes.Axes或其中的 numpy.ndarray

也可以看看

matplotlib.pyplot.scatter

使用多种输入数据格式的散点图。

例子

让我们看看如何使用 DataFrame 列中的值的坐标绘制散点图。

>>> df = pd.DataFrame([[5.1, 3.5, 0], [4.9, 3.0, 0], [7.0, 3.2, 1],
...                    [6.4, 3.2, 1], [5.9, 3.0, 2]],
...                   columns=['length', 'width', 'species'])
>>> ax1 = df.plot.scatter(x='length',
...                       y='width',
...                       c='DarkBlue')

现在颜色也由列决定。

>>> ax2 = df.plot.scatter(x='length',
...                       y='width',
...                       c='species',
...                       colormap='viridis')