Python-Seanborn 第一章 Anscombe's quartet,它告诉人们,数据分析


学习网站:

http://seaborn.pydata.org/examples/scatterplot_matrix.html

一、Anscombe's quartet(安斯库姆四重奏)

1973年,统计学家F.J. Anscombe构造出了四组奇特的数据。它告诉人们,数据分析之前,描绘数据所对应的可视化图形有多么的重要!下面绘制出这四组数据的散点图和线性拟合图

import seaborn as sns
sns.set_theme()

# 加载 “安斯库姆四重奏” 数据集
df = sns.load_dataset("anscombe")

# 画出四组数据的散点图以及线性回归拟合图像
sns.lmplot(
    data = df, x = 'x', y = 'y', col = 'dataset', hue = 'dataset',
    col_wrap = 2, palette = 'muted', ci = None,
    height = 4, scatter_kws = {'s' : 50, 'alpha' : 1}
)

画出散点图后,可以发现这四组数据完全不同,但线性回归的拟合方程却一样,这告诉我们在做回归之前进行数据探索的重要。

参考

  • https://blog.csdn.net/Together_CZ/article/details/86522960
  • https://www.zhihu.com/question/67493742

评论关闭