1
hizoubin 2017 年 7 月 25 日
感觉搜索效果不如 biliworld
|
2
yuedingwangji 2017 年 7 月 26 日
好像还蛮不错的
|
3
LINAICAI 2017 年 7 月 26 日
牛逼
|
4
asheshorse 2017 年 7 月 26 日 via Android
不算全,不过还不错
|
5
WildCat 2017 年 7 月 26 日 via iPhone
666
不过很想知道爬虫原理 |
6
shenyangno1 2017 年 7 月 26 日 via iPhone
搜索条件中包含:和 /会报 500 错。
|
7
ericbize 2017 年 7 月 26 日
专业的爬虫公司被你爬了
|
8
Fe1Fan 2017 年 7 月 26 日
好像真的很好玩
|
9
a494836960 2017 年 7 月 26 日
爬种子很好用
|
10
default7 2017 年 7 月 26 日
怎么弄的?
|
11
Qiss 2017 年 7 月 26 日
速度好快啊,大神用的哪家服务器?
|
12
believeitcould 2017 年 7 月 26 日
匹配模式可以选吗 搜出来的信息太多了 想完全匹配
|
13
Dvel 2017 年 7 月 26 日
速度贼快
|
14
1O 2017 年 7 月 26 日
|
15
frankkai 2017 年 7 月 26 日
可以可以,很强
|
16
jimyan 2017 年 7 月 26 日
牛逼
|
17
Hellofxq 2017 年 7 月 26 日
看起来很好玩的样子,我也想学
|
18
huangzitao OP |
19
nazor 2017 年 7 月 26 日 via iPhone
能不能采集有没有那种带密码的资源。
|
20
ericbize 2017 年 7 月 26 日
@huangzitao 凭自己本事浏览的网页,没什么不阳光的,有本事你 block 了 python requests 的 UA 啊。
|
21
beyoung 2017 年 7 月 26 日
各种链接不存在
|
22
mahone3297 2017 年 7 月 26 日
原理是?
|
23
guodong110 2017 年 7 月 26 日 via Android
http://www.fastsoso.cn 有失效检测
|
24
NAO 2017 年 7 月 26 日
同想完全匹配
|
25
upczww 2017 年 7 月 26 日 via iPhone
原理 site:pan.baidu.com
|
26
ikeeper 2017 年 7 月 26 日
厉害了,求指导
|
27
cenyu 2017 年 7 月 26 日
很厉害,赞一个
|
28
gao117348222 2017 年 7 月 26 日
收藏了
|
30
v166ex 2017 年 7 月 26 日
@suliuyes site:pan.baidu.com 应该不是这个吧,我试了下 bd 没有啥显示
|
31
xmh51 2017 年 7 月 26 日
@huangzitao 现在还能爬吗?百度不在主页显示分享文件后?
|
33
Adamla 2017 年 7 月 26 日
为啥我搜索“拳皇”就会出现错误页面呢。
|
34
sola97 2017 年 7 月 26 日
我平时用的胖次搜索,带失效检测,也能搜到不可告人的东西
|
35
Zioyi 2017 年 7 月 26 日
楼主后台用什么写的
|
37
iphantom 2017 年 7 月 26 日
这个速度很赞 结果也很棒
|
38
iShawnWang 2017 年 7 月 26 日 via iPhone 可以讲解下远离或者开源么... 希望能学习下代码...
|
39
Antidictator 2017 年 7 月 26 日 via Android
借楼问谷歌用 site 语法没什么效果。是不是被屏蔽啦。
再借楼问原理😂😂 |
40
Antidictator 2017 年 7 月 26 日 via Android
@upczww 经常在 Google 用这个语法,但是效果还不如一些类似楼主做的站呢
|
41
upczww 2017 年 7 月 26 日
@Antidictator 那是别人做了二次整理的,分好类的
|
42
huangzitao OP @xmh51 百度网盘前几天被人差评,现在封了很多,所以你懂得
@Adamla 用的第三方中文分词器,后台看了下,有 bug @Zioyi springboot 跟 lucene @iShawnWang 这个也没什么难度啊,无非是爬文件分享链接。 |
43
66kanfengjing 2017 年 7 月 26 日
搜索*会报 500O(∩_∩)O 哈!以前做 lucene 的时候就忘了考虑通配符的问题
|
44
huangzitao OP @66kanfengjing 什么都不写也 500 O(∩_∩)O 这程序不够健壮啊
|
45
66kanfengjing 2017 年 7 月 26 日
@huangzitao 我用 Lucene ( Version:3.5 )的时候用的 IK(Version:2012FF)分词器,目前还没有遇到分词器的 bug.
|
46
Zioyi 2017 年 7 月 26 日
大佬 你是怎么爬下来的?百度云盘有 api ?
|
47
huangzitao OP |
48
zyowe 2017 年 7 月 27 日 |
49
NullException 2017 年 7 月 27 日
666
|
50
hienchu 2017 年 7 月 27 日 via iPhone
不错
|
52
WEAlex 2017 年 7 月 27 日
有源码可以分享一下吗?最近刚把 springboot 和 docker 学习了.
|
53
gao117348222 2017 年 7 月 27 日
@zyowe 稳
|
54
smartdie 2017 年 7 月 28 日
可以啊,这个引擎的速度非常可观。希望能分享下实现方式或者源码。
|
55
huangzitao OP |
56
Hugh123 2017 年 7 月 28 日
需要 66666666
|
57
Dwyanetalk 2017 年 7 月 28 日
贤者,我对这个名字来源感兴趣
|
58
huangzitao OP @Dwyanetalk 哈哈我朋友想的,感觉屌爆了
|
59
propc 2017 年 7 月 29 日 via Android
不错不错
|
60
mooncakejs 2017 年 7 月 29 日
@ericbize 偷偷爬不查你也就算了,show 出来就不行了,殊不知有 robots 协议。
|
61
syl371 2017 年 7 月 29 日
我还是觉得 www.biliworld.com 好用一点
|
62
1002149271 2017 年 7 月 30 日
写这个会不会被抓?
|
63
wanglaihuai 2017 年 7 月 31 日 via Android
如果加上个按照时间排序就更好了大神。
|
64
wilonti 2017 年 7 月 31 日
但是我不知道用啥关键词搜...尴尬了
|
65
yuanfnadi 2017 年 8 月 3 日
|
66
huangzitao OP @yuanfnadi 好👌
|
67
jedihy 2017 年 8 月 8 日 via iPhone
爬 115 吧
|
68
omg21 2017 年 8 月 8 日
你是不是也建了一个数据库,把爬到的内容存进去,然后别人在你主页上搜的时候,再数据库里读取?
|
69
aifang 2017 年 8 月 8 日
感觉好牛逼的样子,肯定比我牛逼,😁
|
70
huangzitao OP |
71
weilongs 2017 年 8 月 11 日
上面那个搜私房不过瘾,http://wiseso.cc/search?keyword=DCIM
|
72
aosp 2017 年 8 月 11 日
我也很好奇,现在只能抓分享动态了吗?那不是得关注很多人
|
73
mon3 2017 年 8 月 15 日
@huangzitao 分享列表已经关闭了,你现在是咋爬的百度云?
|
75
weilongs 2017 年 8 月 16 日
@YoungBai http://www.fastsoso.cn/search 这个搜 私房,DCIM,我的照片,照片 过瘾 !!
|
76
sunnyzhi 2017 年 8 月 25 日
还不错,谢谢
|
77
huangzitao OP @sunnyzhi 老哥,不用客气
|