python数据分析学习(7)数据清洗与准备(1)，

文章由Byrx.net分享于2020-04-13 09:04:38评论（233）

python数据分析学习(7)数据清洗与准备(1)，

一：处理缺失值
- 1. 过滤缺失值
二：补全缺失值

关于文件的读写方面先放一下，接下来介绍数据清洗方面的知识。有时候数据对于特定的任务来说格式并不正确，需要转化为更加适合的数据形式。这里介绍数据清洗的有关基础知识，本篇博客先介绍如何处理缺失值。

一：处理缺失值

缺失数据在很多数据分析应用中都出现过，对于数值型数据，pandas使用浮点值NaN来表示缺失值。可以用isnull()对一直数组逐元素进行操作，返回布尔型判断结果，返回缺失值，而notnull相反。

在pandas中，用R语言中的编程惯例，将缺失值成为NA(not available)，表示不存在的数据或者是不可观察的数据。而python内建的None值在对象数组也被当作NA处理。

可以用fillna填充缺失的数据，或使用'ffill'和'bfill'插值方法。