V2EX = way to explore
V2EX 是一个关于分享和探索的地方
现在注册
已注册用户请  登录
V2EX  ›  binux  ›  全部回复第 281 页 / 共 338 页
回复总数  6758
1 ... 277  278  279  280  281  282  283  284  285  286 ... 338  
2013-12-30 11:18:21 +08:00
回复了 314x 创建的主题 问与答 谁能用一句话说说用python编程做网站的本质是什么?
做网站
至少乘4
2013-12-29 16:57:31 +08:00
回复了 captain234 创建的主题 求职 我叫你一声你敢答应吗?
说真的,一个会八皇后,百万数据会怎么处理,会算法的,会排列组合,比一个会PHP的有价值多了。特别是校招
2013-12-28 14:29:21 +08:00
回复了 pc10201 创建的主题 Python 多线程下的print换行问题
用logging
小红点秒杀任何触摸板,不服来辩!
人工申诉baidu也是,让你输密码,旁边还专门提示,记不清也没关系,客服会根据是否相似判断
2013-12-26 21:45:11 +08:00
回复了 pc10201 创建的主题 Python yinyuetai.com音悦台 80万数据采集
book.douban.com豆瓣读书 600+万数据采集

1. id不是连续的,而且id不一定是数的,不过可以根据跳转后的域名是不是book判断
http://book.douban.com/subject/25785270/

2. 如何更全地获取全量数据
由于douban是没有穷举接口的,要获取所有的书很不方便,于是有
方案一:follow tag列表,但是会经常遇到重复的书,follow的量都快赶上书的量了
方案二:isbn穷举,从dangdang、amazon、京东商品列表是可以遍历的,通过获取他们的图书信息,获得isbn库,通过 https://api.douban.com/v2/book/isbn/ 接口获得书的地址

3. 豆瓣有防采集机制,大约每秒1个以上就会被封,早期导致我们的一个IP被封了一年
解决方案:抓取公开的代理列表,通过代理抓取,多重试
2013-12-24 23:28:05 +08:00
回复了 xiaop 创建的主题 站长 Sogou的蜘蛛怎么这么疯狂?堪比DDoS了
又到年底覆盖率评估的时候了
2013-12-24 18:35:38 +08:00
回复了 arbipher 创建的主题 分享发现 [不黑]一些缩写的读法
重要的不是读得对不对,而是读错的时候能让别人跟着读错
2013-12-23 23:16:44 +08:00
回复了 zzNucker 创建的主题 程序员 360真是毫无底线啊,为了抢入口连越狱这块都伸手了。
@likuku 可以是的
2013-12-23 21:31:45 +08:00
回复了 zzNucker 创建的主题 程序员 360真是毫无底线啊,为了抢入口连越狱这块都伸手了。
@likuku windows/linux/osx都可以简单地root,本身原装系统严密的安全壁垒/沙盒,就被打破了吗?
2013-12-23 00:46:24 +08:00
回复了 tangzx 创建的主题 分享创造 chnroutes 在线版
@tangzx 默认不走VPN,路由表中的ip走VPN
这个是抽中国ip,默认走VPN,路由表中的ip(中国ip)不走
2013-12-22 22:36:49 +08:00
回复了 tangzx 创建的主题 分享创造 chnroutes 在线版
有没有反过来,默认不走VPN的路由列表(有人维护的)
2013-12-22 15:27:43 +08:00
回复了 pythonee 创建的主题 问与答 vim中怎么优雅的执行python代码
没有上下文,执行一段代码有什么意义?或者你不写测试的?
2013-12-20 22:48:00 +08:00
回复了 ctyun 创建的主题 分享发现 百度神奇的搜索结果
因为那个时间是从页面上提的,提错了吧
费电。。
1 ... 277  278  279  280  281  282  283  284  285  286 ... 338  
关于   ·   帮助文档   ·   博客   ·   API   ·   FAQ   ·   实用小工具   ·   3251 人在线   最高记录 6679   ·     Select Language
创意工作者们的社区
World is powered by solitude
VERSION: 3.9.8.5 · 59ms · UTC 12:40 · PVG 20:40 · LAX 04:40 · JFK 07:40
Developed with CodeLauncher
♥ Do have faith in what you're doing.