1
1992w 2020-01-16 16:03:39 +08:00
直接爬,遇到问题就解决问题。
|
2
huadaonan OP 直接卡到 用 selenium + 代理模式也爬几条就封掉了 就没什么好办法了
|
3
linbingqinag 2020-01-16 16:21:26 +08:00 via Android
GitHub 上可以看看,有很多实现
|
4
murmur 2020-01-16 16:21:30 +08:00
爬虫都是小事,反扒那是个人吃饭的东西别人怎么会给你,一个淘宝就是顶级难度了还加了个等。。
|
5
huadaonan OP 嗯 加一条 可以付费的
|
6
ccoming 2020-01-16 16:32:39 +08:00
我觉得爬完淘宝,其他都不是事儿。
虽然我是瞎说的,哈哈哈。 |
7
jdgui 2020-01-16 16:33:27 +08:00
爬虫高手你估计得在监狱里面找
|
8
matepi 2020-01-16 16:37:28 +08:00 via iPhone
有好的成套解决方案的,早就按服务 /次数 /条数收费了
拿可收费的吃饭工具出来卖的,说明问题还不少,要么就是直接吃饭风险太大,只卖个工具风险分散点 |
9
mmqc 2020-01-16 16:44:08 +08:00
爬虫写得好,牢饭吃到老
|
10
shimengren 2020-01-16 16:53:26 +08:00
借楼,有没有 python 学习群呀,想加入学习下哈哈
|
11
ClericPy 2020-01-16 17:02:48 +08:00
0. 想学爬虫, 爬淘宝吧
1. 反爬太猛了, 好像 App 能爬 2. 呀, 不是明文 HTTP 的 3. 反编译看看 Java 源码 4. 威武威武威武威武..... |
12
sprit 2020-01-16 17:04:20 +08:00
坐牢的那种
|
13
linglongll 2020-01-16 17:07:50 +08:00
最近在拿 puppeteer 爬一点 ins 的图 发现这种模拟浏览器的模式很棒 不知道 tb 对这个反爬做了什么拦截么 没动过 也不敢动。。。
|
14
Tn5ohB1Yecdk3qCK 2020-01-16 17:08:08 +08:00
高手在牢里呢
|
15
zdnyp 2020-01-16 17:10:23 +08:00
爬虫要学的太多了,培训班教的都是基础,找本书入门都比培训班强...
|
16
fancy111 2020-01-16 17:14:01 +08:00
淘宝做得不错,主要是价格难爬。
目前只找到两种方法。 |
17
kevinmissu 2020-01-16 17:16:22 +08:00
建议你先开始爬淘宝 然后你会发现 我特么是脑袋抽风要来学爬虫?劝退利器
|
18
tomczhen 2020-01-16 17:18:19 +08:00 via Android
正常用户浏览淘宝速度快点都能触发反爬,说简单的自己有没有实践过爬多点商品的?
|
19
ShundL 2020-01-16 17:22:16 +08:00
牢里 爬虫、外挂,攻击都就学会了
|
20
liuxu 2020-01-16 17:22:26 +08:00
淘宝正常浏览宝贝都能触发验证码,还是无限那种
|
21
scyangjian 2020-01-16 17:22:35 +08:00
17L+1
淘宝太凶残了 |
22
yumenlong 2020-01-16 17:23:37 +08:00
我在爬淘宝,来吧,只有 app 一条路。
|
23
VermouthcZzz 2020-01-16 17:25:34 +08:00
面向监狱编程🐴
|
24
Vhc001 2020-01-16 17:30:10 +08:00
1、从未爬过淘宝。
2、正常淘宝购物都被识别为爬虫的我迫不得已只能注册了京东账号。 3、京东电脑网页版登陆,验证码滑块划了十分钟几百次还是验证不通过,被迫下载京东 app 扫码才能登陆。 我太难了 |
25
XavierXJ 2020-01-16 19:09:43 +08:00 via iPhone
这样一种思路:让软件模拟鼠标点击,截图桌面分析文字和图片,想要多线程的话,浏览器多开,开虚拟机
|
27
Eugene1024 2020-01-16 19:46:13 +08:00
随便学下法律
|
28
explorerEX 2020-01-16 20:17:24 +08:00
@fancy111 哪两种方法 能提示下吗
|
29
wersonliu9527 2020-01-17 10:01:56 +08:00
如果数据量不是太多,几个月前用过一种方法爬淘宝. 命令行开启一个 谷歌浏览器指定端口,再登录个小号,然后 selenium 去对接这个端口可以爬几十页.不知道现在还行不行0.0
|
30
Mavious 2020-01-17 10:40:50 +08:00
咸鱼(搭配手机浏览器)和淘宝 PC 端,人肉浏览都经常蹦滑动验证码,用鼠标去滑老是失败(我明明滑到底了)。
你看正常用户都经常失败,那爬虫的难度真是不可想象…… |
31
RSDTE 2020-01-17 12:54:05 +08:00
爬了淘宝, 能下单的那种.. .
|
32
Iamnotfish 2020-01-18 00:04:26 +08:00 1
降低点难度,先从微博开始爬。现成可用的代码也很多,推荐一个项目 weibospider
|
33
FaceBug 2020-01-18 15:02:59 +08:00
哈哈哈,你来我这干活啊,靠抓 amz、fb、aliexpress、ebay……吃饭的公司
|
35
huadaonan OP 多谢大家踊跃出谋划策,我会阶段性汇报学爬虫的进展。我觉得可能还是做专项分析靠谱,针对问题找大家咨询。群策群力还是好
|