爬虫爱好者一枚,写了两个系列的爬虫教程,分享给有需要的人,后续会不定时更新
第一课 找个软柿子捏捏 http://blog.csdn.net/youmumzcs/article/details/51373830
第二课 实战尚妆网分页商品采集爬虫 http://blog.csdn.net/youmumzcs/article/details/51383648
第三课 实战尚妆网 AJAX 请求处理和内容提取 http://blog.csdn.net/youmumzcs/article/details/51384741
第四课 淘宝网商品爬虫自动 JS 渲染 http://blog.csdn.net/youmumzcs/article/details/51385856
第五课 京东商品评论爬虫 一起来对付反爬虫 http://blog.csdn.net/youmumzcs/article/details/51396283
第一课 p2p 网贷爬虫( XPath 入门) http://blog.csdn.net/youmumzcs/article/details/51455296
第二课 雪球网股票爬虫(正则表达式入门) http://blog.csdn.net/youmumzcs/article/details/51463991
第三课 雪球网股票爬虫( ajax 分析) http://blog.csdn.net/youmumzcs/article/details/52033622
第四课 雪球网股票爬虫(单页面多数据) http://blog.csdn.net/youmumzcs/article/details/52047814
大家对什么爬虫最有兴趣,想用爬虫获取什么数据,有什么反馈建议,都欢迎留言
1
oceantree OP 不是刚发的帖子,怎么变成 4 小时之前的了
|
2
sanwenshi 2016-07-28 14:26:03 +08:00
支持一个
|
3
oceantree OP 一打开消息
165 次点击 ∙ 14 人收藏 就没人给个意见啥的 |
4
qiayue 2016-07-28 15:59:13 +08:00
90 分钟 16 个收藏很不错了,说明还是有人认可你的教程的
|
6
ango 2016-07-28 16:01:56 +08:00
收下了,有时间再看看
|
7
Myflos 2016-07-28 16:20:32 +08:00
干货,先收了
|
10
harry890829 2016-07-28 16:36:14 +08:00
不知道评论什么,反正晚点回去看看
|
11
kchum 2016-07-28 16:40:26 +08:00
是不是还可以上一下分布式爬虫,调度之类的。
|
12
Wy4q3489O1z996QO 2016-07-28 16:41:25 +08:00
有什么办法使用 cacheImg 处理图片数组吗?
|
13
aidoudou 2016-07-28 16:42:50 +08:00
先收藏,再慢慢看
|
16
coolair 2016-07-28 17:04:52 +08:00
这些东西没什么意义吧?主要就是分析链接?
推广你的“神箭手云爬虫 框架”? “神箭手云爬虫 框架”在哪?开源吗? |
17
abctest 2016-07-28 17:08:33 +08:00
|
18
oceantree OP |
19
Wy4q3489O1z996QO 2016-07-28 17:18:56 +08:00
@oceantree cacheImg 返回了奇怪的东西: shenjianshou://http://image.xx.com/showImage.aspx?t=a1&v=10000A998
|
20
qiayue 2016-07-28 17:19:12 +08:00
文章还是有价值的,不过建议楼主(神箭手 CEO )下次来 V2EX 发帖,就正正当当的在文章开头表明身份表明利益关系更好。
我玩 V2EX 五六年了,一般来讲真心实意来推广自己产品的,广大 V 友是欢迎的,但是如果遮遮掩掩来推广,反倒不受欢迎。 比如前几天的 OneAPM 演了一场戏,结果被扒皮了。 |
21
harry890829 2016-07-28 17:21:25 +08:00
@abctest 我粗略看了一眼文章,大概了解了一下,发现是软文,或者说是推广吧,不过当时没有明说……
|
22
oceantree OP |
23
123s 2016-07-28 17:25:25 +08:00 via iPhone
已加入豪华午餐
|
25
vtea 2016-07-28 17:28:50 +08:00 via iPhone
顶楼主,最近写爬虫卡在爬 ajax 类动态网页上了
|
28
miao 2016-07-28 19:03:37 +08:00
果然是软文. 好在可以防爬虫
|
30
upczww 2016-07-28 19:31:34 +08:00
神箭手的广告
|
31
nikola 2016-07-28 19:40:11 +08:00
mark
|
32
oceantree OP |
33
pheyer 2016-07-29 12:40:56 +08:00
lz 有试过把淘宝全部商品爬完要多长时间吗?
|
35
cangbaotu 2016-08-15 19:41:46 +08:00
赞作者,刚好需要,赶紧去拜读一下( ̄▽ ̄)"
|
37
jy00566722 2017-05-14 22:53:41 +08:00
@oceantree 太贵了,不给人入门窥探的机会。 我还充了值,以为市场里那些爬虫可以玩一把。
仔细一看才发现自己多天真,原来是要会员等才可以用的。随便一个有用的都是个人旗舰版。还是整 scrapy 吧。 |