1
ericls 2015 年 6 月 20 日
既然都用了 Python3 了
如果真的是「爬虫」,也应该用aiohttp之类的异步吧 |
2
n37r06u3 2015 年 6 月 20 日
都是漫黄站啊
|
3
binux 2015 年 6 月 20 日
人家明明有 API,你非得解析页面
http://konachan.com/post.json |
11
wudaown OP @binux http://konachan.com/post.json?page=2&tags=yuuki_asuna 是第二页的json
http://konachan.com/post.json?page=1&tags=yuuki_asuna 是第一页的json ... 分析完一页不是要分析第二页么.. |
19
KyoHiroki 2015 年 6 月 21 日
1.html页面如果有用js生成的动态内容,你是爬不到的,json没有这个问题;
2.渲染html页面对服务器的负担比json大; 3.html页面可能会经常修改,不易维护。 |