V2EX = way to explore
V2EX 是一个关于分享和探索的地方
现在注册
已注册用户请  登录
V2EX 提问指南
chole
V2EX  ›  问与答

小白如何利用 python,写一个自动查询的脚本

  •  
  •   chole · 2016-07-02 23:34:17 +08:00 · 2900 次点击
    这是一个创建于 3052 天前的主题,其中的信息可能已经有所发展或是发生改变。

    工地搬砖狗一名,最近领导让我管理试验用的标准文件,每隔一段时间都需要在工标网上对现有的标准进行搜索,检查现行标准是否有更新。请问如何通过 python 自动重复这一过程?

    查询的网址 http://www.csres.com/s.jsp?keyword=GB+18242-2008 GB+18242-2008 是标准文件的标准号 每次都要搜索上百个这样的标准文件

    8 条回复    2016-07-03 00:54:54 +08:00
    ZGLHHH
        1
    ZGLHHH  
       2016-07-02 23:38:25 +08:00
    urllib 库
    requests 库
    正则表达式
    chole
        2
    chole  
    OP
       2016-07-03 00:10:02 +08:00
    @ZGLHHH 能不能给小白一个栗子?
    ZGLHHH
        3
    ZGLHHH  
       2016-07-03 00:15:09 +08:00
    @chole
    我只能给个逻辑:
    第一次爬取->正则表达式将数据分割成一个个数组->存库
    之后的爬取->正则表达式将数据分割成一个个数组->当前数据与存库的数据进行比较判断->后续操作
    chole
        4
    chole  
    OP
       2016-07-03 00:19:32 +08:00
    @ZGLHHH ok 谢谢啦 我再摸索摸索
    jswh
        5
    jswh  
       2016-07-03 00:41:55 +08:00
    说真的,这种简单的需求,如果不是为了自己要学习,而是单纯解决问题,猪八戒上稍微花点钱就好了......
    liqingcan
        6
    liqingcan  
       2016-07-03 00:42:59 +08:00
    花点钱 请别人解决最快
    chole
        7
    chole  
    OP
       2016-07-03 00:46:30 +08:00
    @jswh 哈哈,说得很对,确实主要还是为了学习。一直觉得 python 很有意思,但是缺少学习的动力。
    jswh
        8
    jswh  
       2016-07-03 00:54:54 +08:00
    @chole 学习的话,解决这种问题的基本就是爬虫。可以了解一下 python 爬虫的基本思路,基本找个入门教程跟着做做就好了。然后再针对具体问题,应用爬虫的思路,选择具体的工具来操作。
    关于   ·   帮助文档   ·   博客   ·   API   ·   FAQ   ·   实用小工具   ·   2718 人在线   最高记录 6679   ·     Select Language
    创意工作者们的社区
    World is powered by solitude
    VERSION: 3.9.8.5 · 26ms · UTC 07:19 · PVG 15:19 · LAX 23:19 · JFK 02:19
    Developed with CodeLauncher
    ♥ Do have faith in what you're doing.