V2EX = way to explore
V2EX 是一个关于分享和探索的地方
现在注册
已注册用户请  登录
V2EX  ›  binux  ›  全部回复第 178 页 / 共 338 页
回复总数  6758
1 ... 174  175  176  177  178  179  180  181  182  183 ... 338  
2016-05-22 18:17:32 +08:00
回复了 odoooo 创建的主题 Lua 正在用 lua 写一个 nginx 防盗链的拓展,遇到了一个问题。
对 UID 签名
2016-05-22 04:17:20 +08:00
回复了 ITOutsider 创建的主题 问与答 V2EX 底部的机场时间如何有更好的 js 实现?
老实说,你这段代码是去哪抄的?
2016-05-21 05:51:58 +08:00
回复了 taevas 创建的主题 Apple apple id 严重有问题
@donotgo 用帐号密码能改安全问题的答案?你不要骗我
当你知道密码被改了,你可以通过安全答案,安全邮箱找回。

当你登录名被改了,你没法(很难)找回,注意区别
2016-05-21 05:18:10 +08:00
回复了 taevas 创建的主题 Apple apple id 严重有问题
@donotgo 你的假设是用户帐号永远不会被盗,这显然是不现实的。
而这里讨论的是被盗之后帐号能不能找回

密码被改了,你可以通过安全答案,邮箱找回。
邮箱被改了,你打算用什么找回?
2016-05-21 05:16:04 +08:00
回复了 taevas 创建的主题 Apple apple id 严重有问题
2016-05-21 05:14:23 +08:00
回复了 taevas 创建的主题 Apple apple id 严重有问题
@nvidiaAMD980X 就是因为效率低才需要多级啊,难道你整天改登录邮箱的吗?
2016-05-20 07:01:16 +08:00
回复了 taevas 创建的主题 Apple apple id 严重有问题
@donotgo 多级认证不很正常吗?“非所有者”也能登录你的帐号,这样的事情还少吗?
2016-05-20 06:20:39 +08:00
回复了 taevas 创建的主题 Apple apple id 严重有问题
1 、帐号+密码并不能确定你就是 Apple ID 的所有者,如果可以,还要密保答案干嘛?既然有更高一级的验证干嘛不用?
2 、密码被改了可以找回,帐号被改了可以吗?
2016-05-20 06:10:29 +08:00
回复了 taevas 创建的主题 Apple apple id 严重有问题
@nvidiaAMD980X 那为什么还要密保答案?
2016-05-20 04:52:10 +08:00
回复了 arrowna 创建的主题 程序员 有哪些开源下载软件可以和 utorrent 媲美么?
utorrent 特性那么多,你到底觉得哪点好?
又没有开源下载软件全盘复制 utorrent 的功能的,你不说清楚怎么比?
2016-05-20 04:29:14 +08:00
回复了 oglop 创建的主题 问与答 哪个 js 的带高亮的 code editor 能让我复制带高亮的 html?
能不能复制这和 code editor 有什么关系?你试试往 web gmail 或者 <html contenteditable> 粘贴,本来就是带高亮的。
2016-05-19 21:29:32 +08:00
回复了 icedx 创建的主题 问与答 求推荐爬虫的代理池 要求文档 接受收费服务
2016-05-19 21:21:26 +08:00
回复了 icedx 创建的主题 问与答 求推荐爬虫的代理池 要求文档 接受收费服务
crawlera?
2016-05-19 18:12:03 +08:00
回复了 SlipStupig 创建的主题 Python 爬虫抓取速度自适应问题
@SlipStupig 压力控制和挖掘本来就可以独立为一个或者多个模块,你居然称之为「零散代码」,你的系统到底有多小?

既然你说你的爬虫「功能跟百度蜘蛛一样」,我告诉你的第一个方案就是「百度蜘蛛」所用的。
当然,根据你爬虫的规模,可以使用简化的方法。但是根据是否需要快启动,你手头永远的数据,是否要防 ban ,你永远的 ip 池大小,以及你要达到的效果;方法实在是太多。你是否真的想清楚了?
2016-05-19 15:49:22 +08:00
回复了 SlipStupig 创建的主题 Python 爬虫抓取速度自适应问题
连查一下 Alexa 都会流量浪费,存 100 万都成本高。。你资源到底多么少啊。。我怀疑你根本没能力给一个非共享的正经网站抓挂了。
看来我一开始就问你有多少时间和资源真是问对了。
2016-05-19 02:39:17 +08:00
回复了 SlipStupig 创建的主题 Python 爬虫抓取速度自适应问题
@SlipStupig
如果是这样
首先,你的系统必须得支持分站点压力控制吧。
然后抓之前,先看看对方站点有多少 IP ,查一下站点排名,流量,然后就能定一个差不多的抓取压力了。
2016-05-19 00:53:34 +08:00
回复了 SlipStupig 创建的主题 Python 爬虫抓取速度自适应问题
@SlipStupig
分站点统计都做不到吗?
你不是说时间很充足吗。。这点数据积累都没有?遇到新网站的概率才多少。。从一个初始值开始做就行了啊。

所以我问你有多少时间和资源做这件事啊,你看,我给你一个时间很多的方案,你又说不行。
2016-05-19 00:47:44 +08:00
回复了 SlipStupig 创建的主题 Python 爬虫抓取速度自适应问题
@binux 响应时间和错误率
2016-05-19 00:46:02 +08:00
回复了 SlipStupig 创建的主题 Python 爬虫抓取速度自适应问题
@SlipStupig 那你可以统计待抓链接量和上一天的平均响应时间,尝试放大并发,一天之后看平均响应时间是否有变化。没有就继续加大。
1 ... 174  175  176  177  178  179  180  181  182  183 ... 338  
关于   ·   帮助文档   ·   博客   ·   API   ·   FAQ   ·   实用小工具   ·   1099 人在线   最高记录 6679   ·     Select Language
创意工作者们的社区
World is powered by solitude
VERSION: 3.9.8.5 · 46ms · UTC 18:30 · PVG 02:30 · LAX 10:30 · JFK 13:30
Developed with CodeLauncher
♥ Do have faith in what you're doing.