同题,之所以想开这个 organizations 是因为 1.因为有很多网站的反爬手段都很类似,把这些反爬手段收集起来能够给做爬虫的兄弟们一些借鉴。 2.爬虫本身有时候是很繁琐的一件事情,在 api,网页,源码中寻找数据,所以希望开源一些实际生产环境的解决方案让大家使用 3.爬虫这个岗位确实很有挑战性,大家也可以谈谈自己爬过的艰难的网站。
来吧,留下你的 github 名,加入我们!
1
CharlieBrown 2018-11-28 11:57:09 +08:00
|
2
37Y37 2018-11-28 13:24:51 +08:00
乱爬数据不是违法的么^-^
|
3
Lateautumn OP @37Y37 这个应该这么说,我们只是交流想法,具体爬的话不是得对应到具体人,具体公司吗,这个我们就不管了,大家都是为了技术嘛
|
4
Lateautumn OP @CharlieBrown 好的,
|
5
Lateautumn OP @CharlieBrown 老哥,已经邀请了,点击这个网址接受就好了 https://github.com/AntiCrawlerSolution
|
6
Les1ie 2018-11-28 15:51:06 +08:00
|
7
est 2018-11-28 15:56:25 +08:00
反扒还需要手段?谁爬就报警。
|
8
dezhou9 2018-11-28 15:58:19 +08:00 via Android
爬虫组干过俩月的路过
|
9
Lateautumn OP 这个 github 之前也关注过,确实很优秀,不过我觉得还是内容比较少,一些方法也是比较旧了,所以希望有个 organizations 来让大家更加能够及时获取这些前沿的反爬手段以及对应的解决方案
|
10
Lateautumn OP @est 老哥牛比阿
|
11
Lateautumn OP @dezhou9 兄弟什么方向的
|
12
ooh 2018-11-28 18:24:00 +08:00
内容图片输出即可
|
13
andylsr 2018-11-28 18:36:50 +08:00 via Android
andylsr~常年爬数据~
|
14
Lateautumn OP @andylsr 老哥,已发
|
15
Lateautumn OP @ooh ???
|
16
Nick2VIPUser 2018-11-28 20:59:48 +08:00
nickliqian
|
17
freakxx 2018-11-28 21:50:28 +08:00
chrisguox
|
18
Sparetire 2018-11-28 22:00:34 +08:00
|
19
zsl199512101234 2018-11-28 22:50:12 +08:00
https://github.com/PinoZhou 在公司写爬虫,主要是 java 爬虫,python 也会点,希望加入一起学习
|
20
stardiviner 2018-11-29 09:09:09 +08:00
|
21
519718366 2018-11-29 09:50:37 +08:00
工作上也爬~~被反扒了,就 sleep 时间长一点,楼主这个反扒方案很给力啊
相见恨晚,学习了 |
22
dongya 2018-11-29 13:52:10 +08:00
相煎何急
|
23
yongSir 2018-11-29 15:02:26 +08:00
|
24
Lateautumn OP @Nick2VIPUser 老哥已发
|
25
Lateautumn OP @freakxx chrisguox
|
26
Lateautumn OP @zsl199512101234 PinoZhou
|
27
Lateautumn OP @Sparetire PinoZhou
|
28
Lateautumn OP @yongSir 13hoop
|
29
Lateautumn OP @Sparetire 之前也遇到过反调试的,不知道老哥你这个怎么样,star 你一下
|
30
mmdsun 2018-11-29 18:54:36 +08:00 via Android
|
31
Lateautumn OP @mmdsun 老哥已发
|
32
kenneth663 2018-11-30 12:03:03 +08:00
|
33
Lateautumn OP @kenneth663 兄弟上车
|
34
Lateautumn OP 新开了个反爬小组的微信群,老哥们可以加入一下
![反反爬小组]( https://github.com/lateautumnlin/PicCenter/blob/master/%E5%BE%AE%E4%BF%A1%E5%9B%BE%E7%89%87_20181202131436.jpg) |
35
ranlele 2018-12-02 16:52:40 +08:00
我看的怎么只有目录啊
|
36
Lateautumn OP @ranlele 目前还在填充具体的细节,老哥稍等哈,也可以共享一下自己的案例哈
|
37
wc110302 2018-12-03 09:48:15 +08:00
|
38
Lateautumn OP |