V2EX = way to explore
V2EX 是一个关于分享和探索的地方
现在注册
已注册用户请  登录
fanqieipnet
V2EX  ›  推广

如何处理 Pandas 中的空值?

  •  
  •   fanqieipnet · 2020-12-23 17:26:32 +08:00 · 754 次点击
    这是一个创建于 1434 天前的主题,其中的信息可能已经有所发展或是发生改变。
    如何处理 Pandas 中的空值?今天番茄加速就来跟大家探讨一下。

      只要和数据打交道,就不可能不面对一个令人头疼的问题-数据集中存在空值。空值处理,是数据预处理之数据清洗的重要内容之一。

       Python 数据分析包 Pandas 提供了一些便利的函数,可以帮助我们快速按照设想处理、解决空值。

      空值处理的第一招:快速确认数据集中是不是存在空值。有两个函数 isnull, notnull,可以帮助我们快速定位数据集中每个元素是否为空值。

      说到空值,在 NumPy 中定义为:np.nan ,Python 中定义为 None,所以大家注意这种表达方式。这里面有一个坑,就是 Pandas 对象某列或某行,直接拿 np.nan , None 判断元素是否为空,发现返回的都是 False 。注意:这样做是不可取的!

      第二招,假设存在空值,可以使用 Pandas 中的 fillna 函数填充空值,fillna 有一个关键参数:method, 当设置 method 为 pad 时,表示怎样填充呢? 从上一个有效数据传播到下一个有效数据行。此外,还有一个限制连续空值行的数量的关键字 limit.

      第三招,检测到了空值数据,但是不想做任何填充,而是仅仅想丢弃这些空值数据,Pandas 提供了 dropna 函数做这件事情。里面有两个关键参数:axis, how, 例如组合:axis = 0,how =\'any\',表示某行只要某个元素为空值,就丢弃。

      以上就是 Pandas 中,空值处理的基本思路。
    目前尚无回复
    关于   ·   帮助文档   ·   博客   ·   API   ·   FAQ   ·   实用小工具   ·   2858 人在线   最高记录 6679   ·     Select Language
    创意工作者们的社区
    World is powered by solitude
    VERSION: 3.9.8.5 · 21ms · UTC 00:28 · PVG 08:28 · LAX 16:28 · JFK 19:28
    Developed with CodeLauncher
    ♥ Do have faith in what you're doing.