V2EX = way to explore
V2EX 是一个关于分享和探索的地方
现在注册
已注册用户请  登录
爱意满满的作品展示区。
AsmDef
V2EX  ›  分享创造

PyGWalker - 在 Notebook 中用拖拽式的交互界面探索 pandas DataFrame

  •  1
     
  •   AsmDef · 2023-02-21 13:35:42 +08:00 · 1880 次点击
    这是一个创建于 639 天前的主题,其中的信息可能已经有所发展或是发生改变。

    PyGWalker(读作“Pig Walker”,谐音梗扣钱),全称为:“Python binding of Graphic Walker”。

    详情 -> https://github.com/Kanaries/pygwalker

    PyGWalker可以用于简化 Jupyter Notebook 工作流。无需复杂的数据分析和数据可视化步骤,您可以使用 PyGWalker 把 pandas dataframe 转化为直观的图形界面进行编辑。想象一下:在 Jupyter Notebook 中跑起来一个开源的 Tableau 界面,通过简单的拖放操作,就可以完成数据分析和可视化的操作。

    假设你有一个 dataframe

    import pandas as pd
    df = pd.read_csv('./bike_sharing_dc.csv', parse_dates=['date'])
    

    只要

    !pip install pygwalker
    import pygwalker as pyg
    gwalker = pyg.walk(df)
    

    就可以得到一个拖拽式的交互探索分析界面

    可以通过拖放字段来分析和可视化数据。

    使用类似 Tableau 的 UI 手动探索数据

    更多玩法:

    • 将标记类型更改为其他类型以制作不同的图表,例如折线图:

    图形 walker 折线图

    • 要比较不同的度量,可以通过将多个度量添加到行 /列来创建一个连续视图。

    图形 walker 面积图

    • 要制作多个子视图除以维度值的分面视图,将维度放入行或列中以制作分面视图。 规则类似于 Tableau 。

    图形 walker 散点图

    • 可以将数据探索结果保存到本地文件。

    甚至还可以直接在 Kaggle 或 Colab 中使用:

    Run in Kaggle Run in Colab
    https://www.kaggle.com/asmdef/pygwalker-test https://colab.research.google.com/drive/171QUQeq-uTLgSj1u-P9DQig7Md1kpXQ2?usp=sharing
    9 条回复    2023-02-24 17:23:28 +08:00
    shyrock
        1
    shyrock  
       2023-02-21 14:21:21 +08:00
    有意思,能做到傻瓜都可以用吗?
    stefwoo
        2
    stefwoo  
       2023-02-21 16:25:00 +08:00 via iPhone
    看起来很棒
    haoxuexiaoyao
        3
    haoxuexiaoyao  
       2023-02-21 16:33:18 +08:00
    支持多少图形可视化类型呢
    AsmDef
        4
    AsmDef  
    OP
       2023-02-21 16:38:18 +08:00
    @shyrock 可以顺便看一下 github.com/Kanaries/Rath ,之后我们准备把这里的一些自动推荐的功能也移植到 python 生态中,希望能够实现这个远大目标😜
    fractalbanana
        5
    fractalbanana  
       2023-02-21 16:44:23 +08:00
    @haoxuexiaoyao vega-lite 能做的大部分都可以实现。
    AsmDef
        6
    AsmDef  
    OP
       2023-02-21 16:49:04 +08:00
    @haoxuexiaoyao 可以了解一些 Vega & Vega-lite (或者 Python 中的 Vega-Altair )和图形语法,它是对可视化类型的一种抽象,优势是可以方便组合和替换,但并不关注具体的 chart 类型
    mmm159357456
        7
    mmm159357456  
       2023-02-21 17:04:15 +08:00
    马上推荐给同事
    sbilly
        8
    sbilly  
       2023-02-22 11:21:11 +08:00
    支持地理地点的可视化么?
    fractalbanana
        9
    fractalbanana  
       2023-02-24 17:23:28 +08:00
    @shyrock 有多傻
    关于   ·   帮助文档   ·   博客   ·   API   ·   FAQ   ·   实用小工具   ·   3660 人在线   最高记录 6679   ·     Select Language
    创意工作者们的社区
    World is powered by solitude
    VERSION: 3.9.8.5 · 20ms · UTC 04:17 · PVG 12:17 · LAX 20:17 · JFK 23:17
    Developed with CodeLauncher
    ♥ Do have faith in what you're doing.