V2EX = way to explore
V2EX 是一个关于分享和探索的地方
现在注册
已注册用户请  登录
V2EX  ›  binux  ›  全部回复第 195 页 / 共 339 页
回复总数  6773
1 ... 191  192  193  194  195  196  197  198  199  200 ... 339  
2015-12-25 19:55:17 +08:00
回复了 lx19930805 创建的主题 问与答 早期的网页爬虫是如何进行的?
审查元素只是帮你建树并定位节点,但是 HTML 源代码本事就存在的,即使没有审查元素,也可以脑内建树嘛。
而且早期的页面,没有那么多复杂的元素<h1>就是<h1>,<li>就是<li>,结构清晰得多。
LZ 光铜币就挣了 2000 多了,「充值 60 元获得 2,400 铜币」价值 51 块钱啊!
他们家自己的苹果,包邮 10 斤才 38 块钱啊!
2015-12-25 02:33:56 +08:00
回复了 Feiox 创建的主题 程序员 如今这各种大学生创业比赛啊。。。人心开始越来越浮躁了 ~
只要认真做,也没什么不好。
如果是去混的,那混什么不是混呢。
2015-12-24 21:49:29 +08:00
回复了 RqPS6rhmP3Nyn3Tm 创建的主题 Python 第一次写 Python 爬虫,是用来抓漫画的
@BXIA 配置文件也可以啊, 还可以保存起来重复利用.
2015-12-24 21:45:39 +08:00
回复了 RqPS6rhmP3Nyn3Tm 创建的主题 Python 第一次写 Python 爬虫,是用来抓漫画的
@BXIA 啊, 居然是 input() 读入的... 好吧.. 也行吧..
2015-12-24 21:28:52 +08:00
回复了 RqPS6rhmP3Nyn3Tm 创建的主题 Python 第一次写 Python 爬虫,是用来抓漫画的
那, 既然 README 说要按格式写出正则, 那至少把可配置的部分独立出来, 好让人知道在哪改吧, 不然还得看代码.
然后既然可以配置了, 不可能每次配置复制一份代码吧, 所以把它做成类, 把参数传进去可好.
aws 各种服务就是这样的, 逐层封装就好了, 有什么不合理的?
2015-12-20 22:43:10 +08:00
回复了 ooTwToo 创建的主题 问与答 台灯到底有没有辐射?辐射多大?如何计算呢?
不错过 6.3W
1 ... 191  192  193  194  195  196  197  198  199  200 ... 339  
关于   ·   帮助文档   ·   自助推广系统   ·   博客   ·   API   ·   FAQ   ·   Solana   ·   2654 人在线   最高记录 6679   ·     Select Language
创意工作者们的社区
World is powered by solitude
VERSION: 3.9.8.5 · 60ms · UTC 08:13 · PVG 16:13 · LAX 00:13 · JFK 03:13
♥ Do have faith in what you're doing.