教育行业A股IPO第一股(股票代码 003032)

全国咨询/投诉热线:400-618-4000

Python数据预处理:dropna()函数的用法讲解

更新时间:2022年11月04日11时24分 来源:传智教育 浏览次数:

好口碑IT培训

  在Python中,我们可以通过dropna()方法来删除含有空值或缺失值的行或列,其语法格式如下:

dropna(axis=0, how='any', thresh=None, subset=None, inplace=False

  上述方法中部分参数表示的含义如下:

  (1)axis:确定过滤行或列,取值可以为:

  ◆0或index:删除包含缺失值的行,默认为0。

  ◆1或columns:删除包含缺失值的列。

  (2)how:确定过滤的标准,取值可以为:

  ◆any:默认值。如果存在NaN值,则删除改行或该列。

  ◆all:如果所有值都是NaN值,则删除改行或该列。

  (3)thresh:表示有效数据量的最小要求。若传入了2,则是要求该行或该列至少有两个非NaN值时将其保留。

  (4)subset:表示在特定的子集中寻找NaN值。

  (5)inplace:表示是否在原数据上操作。如果设为True,则表示修改原始数据的副本,返回新的数据。

  假设,现在有一张关于书籍信息的表格,它里面有类别、书名和作者三列数据。其中,在索引为0的一行中作者为None,则表明该位置的数据是空值。如果删除这些空值和缺失值,那么删除前后的效果如图4-1所示。

删除空值/缺失值前后的表格

  图4-1 删除空值/缺失值前后的表格

0 分享到:
和我们在线交谈!