看到有人专名写一个爬虫,于是用手上的东西,做了一个这个东西。
先直接上地址: https://f.binux.me/haixiuzu.html
pyspider DEMO版 + 多说 做数据库 + 前端渲染一个瀑布流
嘿,还真像那么回事有没有。
那么问题来了,还有哪些免费的 KV 数据库,有 HTTP API 的,能公开读取数据的。
多说老是转义导入的数据。。
1
oojiayu 2014 年 10 月 26 日
赞一个
|
2
ihacku 2014 年 10 月 26 日
CouchDB?
|
3
ChiangDi 2014 年 10 月 26 日
豆瓣好奇怪,为什么那么多妹纸晒。。
|
4
can 2014 年 10 月 26 日
不是说晚上管理员一下班,这组就……?
|
6
Shared 2014 年 10 月 26 日
为什么有css和js文件不能加载,主页裸奔了
|
8
shoumu 2014 年 10 月 26 日
看不到图啊
|
11
shoumu 2014 年 10 月 26 日 @binux
控制台信息 Failed to load resource: net::ERR_SSL_VERSION_OR_CIPHER_MISMATCH https://static.duoshuo.com/embed.unstable.js Uncaught ReferenceError: DUOSHUO is not defined haixiuzu.html:62 douban |
13
shakoon 2014 年 10 月 26 日
不能翻页&说好的瀑布流呢?是因为采集数据还太少么
|
14
flyphy 2014 年 10 月 26 日 试试撸女神
http://lunvshen.com |
16
kmvan 2014 年 10 月 26 日
是啥语言采集的?
|
17
binux OP |
18
gipsymoth 2014 年 10 月 27 日
这个好
|
19
muziyue 2014 年 10 月 27 日
有没有能判断性别的图像处理方案……
|
20
jacob 2014 年 10 月 27 日
害羞组是啥玩意,这些图看得我都害羞了- -
|
21
lubuwei 2014 年 10 月 27 日
呃,下班再打开看看......
|
22
shakespark 2014 年 10 月 29 日
为啥里面还有丁丁...
|
23
shakespark 2014 年 10 月 29 日
理解了...各种晒10分钟的图被lz抓取了啊哈哈哈
|
24
hydyy 2014 年 10 月 29 日
。。。
|
25
chilaoqi 2014 年 10 月 29 日
这么多丁丁 大丈夫?
|
27
axe 2014 年 10 月 29 日
害羞组是用来约约约的吗。。
|
28
yangkeao 2014 年 10 月 29 日
我想知道多说做数据库是什么情况。。
|
30
gkuchan 2014 年 10 月 29 日
…… 能不能把女人删掉 搞一个只有男人的版本……
|
32
alsotang 2014 年 11 月 1 日
碉堡了
|
33
2232588429 2014 年 11 月 2 日
这个数据库是采到26号的?上限怎么定的?
|
34
binux OP @2232588429 我只采集了第一页,我是从26号开始采集的。
|
35
wh1100717 2014 年 11 月 20 日 其实你这个还可以加以下功能:
1. 定时check你抓下来的帖子是否删除,如果删除,则高亮显示(原因你懂的) 2. 想办法用算法把广告过滤掉... 3. 增加手动点击发豆油功能(原因你懂的) 4. 增加几个组一起check好了==! 我也写了个一个类似的东西...不过写完就觉得无趣懒得完善了,哈哈 |
37
mnhkahn 2015 年 2 月 25 日
大哥,你这个有些图多说那边没给你处理么?
|
44
zkeeper 2018 年 12 月 4 日
妈的来晚了, 啥都看不见
|