我有一个大约 300 个点的数据集,每个点都有相应的 X 值和 Y 值。数据中还有第三列,带有“质量”标签,要么表示“好”,要么表示“差”,因此我的数据框中有三列数据,其中 2 列是数字,1 列是字符串。
我只是想绘制这些数据点的散点图,其中“好”点为蓝色,“坏”点为红色,并用图例向我显示这种颜色区别。然而我无法在 python 中匹配我在 Excel 中制作的绘图。
在 Excel 中,我简单地绘制了 X 和 Y 列的散点图并得到了这个,这对我来说看起来是正确的:
然后我尝试使用以下代码在 python 中创建此图:
x = df['X']
y = df['Y']
plt.scatter(x, y)
plt.show()
除了看起来可怕地挤在一起的轴刻度线之外,数据点对我来说根本没有任何意义,它们根本不像我制作的 Excel 绘图,它使用完全相同的数据。也许这可能是轴格式问题,但我不知道。
如何修复我的代码以正确捕获 Excel 图中显示的数据点?
假设您已将数据读入 pandas 数据框
df = pd.read_csv("/path/to/your/file")
,并且它具有三列:X
、Y
和Quality
,则以下内容应该可以满足您的要求: