V2EX = way to explore
V2EX 是一个关于分享和探索的地方
现在注册
已注册用户请  登录
V2EX  ›  realpg  ›  全部回复第 207 页 / 共 433 页
回复总数  8654
1 ... 203  204  205  206  207  208  209  210  211  212 ... 433  
2018-05-14 12:48:49 +08:00
回复了 realpg 创建的主题 程序员 感觉,我可能发现了阿里云的一个秘密
又冒出来新的 IP 段了

106.120.160.75 - - "GET /display_article/**** HTTP/1.1" 200 7917 "-" "Mozilla/5.0 (Windows NT 6.2; rv:30.0) Gecko/20150101 Firefox/32.0 360Spider"
2018-05-14 08:40:22 +08:00
回复了 usedname 创建的主题 全球工单系统 B 站的安全做的比京东还好
@Love4Taylor #40
反正我之前的只要一扫码登陆电脑,手机 APP 过一阵子就掉线了……
然后 我已经不登录好多年
2018-05-14 08:36:22 +08:00
回复了 usedname 创建的主题 全球工单系统 B 站的安全做的比京东还好
BILIBI 是多端一个登陆状态
不同设备互相顶
这个智障设计不知道改了没
2018-05-14 08:08:07 +08:00
回复了 F1024 创建的主题 宽带症候群 这个 ip 地址是内网?
内网不能用内网网段的场景多了去了 又不是给公共用的
2018-05-14 08:01:03 +08:00
回复了 realpg 创建的主题 程序员 感觉,我可能发现了阿里云的一个秘密
@alexkh #96
动不动就屏蔽搜索引擎爬虫?这不是自己私人小站随便玩,这些官网认证为了排第一个都是医院花了钱上去的(别看是正规医院官方网站 有时候也是要交保护费的 这方面医院的信息化省里有考核 不排到第一个 有虚假的排到第一个 导致患者找错医院是要被追责的) 搜索引擎收录量都是有考核指标的


@wafm #93
确实挺有发言权的
http://ww1.sinaimg.cn/large/6c2ea0fbly1fraji3d1rwj20m00eeabo.jpg
2018-05-13 17:32:47 +08:00
回复了 realpg 创建的主题 程序员 感觉,我可能发现了阿里云的一个秘密
@CRVV #80

我不认为是阿里云这个大公司层面上去做这种事,根本无法获得公司通过
但是一些自身 KPI 相关的部门小决策会不会这么搞就不好说了

另外,阿里确实没法控制 360,但是架设这个之前有人说的态势感知是一种 360 公开提供的服务(没搜到相关,但是在 360 的网站安全里感觉可能有这个),你如果有个目标列表,自己申请一个,利用一点 360 的验证漏洞或者干脆做个手脚毕竟 IP 地址是自己家的,然后为我订阅个每小时全站扫描一次的态势感知服务,就实现了增加 KPI 的目的了不是
2018-05-13 13:07:20 +08:00
回复了 realpg 创建的主题 程序员 感觉,我可能发现了阿里云的一个秘密
@a1kaid #71
59 的是我屏蔽了所有顶楼说的 IP 之后大约 8 个小时,出现的新的,而且变更了 UA,以前的 UA 就是 MOZILLZ 5.0 FIREFOX 39 360SPIDER 没有别的
应该是一种 failsafe 这个 IP 段的 UA 都不一样 而且没有之前那几个 IP 段那么多机器 就几个机器


另外针对 70 楼 我这个检查了 没有注入参数 就是单纯的 http get 访问正常 URL

这是一个我自己低性能优化的系统,最终的服务程序已经完全内存化了,无法 handle 任何构造请求,稍微多一点参数进来直接就丢 400 错误了几个字节 不会有每个真正的 15KB 每个访问的流量
2018-05-13 13:04:15 +08:00
回复了 realpg 创建的主题 程序员 感觉,我可能发现了阿里云的一个秘密
@a1kaid #70

这些 IP 正常归属 360 的态势感知,之前已经有人说了
现在的问题有两点,第一,这些 IP 是不是真的,至少访问发生的时候是不是真的
第二,69 楼的重点,为啥他只扫我的流量计费的机器,这里面有啥 py 交易么
2018-05-13 11:34:04 +08:00
回复了 realpg 创建的主题 程序员 感觉,我可能发现了阿里云的一个秘密
@snsd #62
并不是一个 IP 地址啊 几百个并发一堆 IP 地址一起上
2018-05-13 10:40:05 +08:00
回复了 realpg 创建的主题 程序员 感觉,我可能发现了阿里云的一个秘密
@badcode #47
爬网站 打着搜索引擎的 UA 伪装很正常 没必要搭理他 内容都是公开的 不怕别人爬 也需要正常搜索引擎搜索
因为我这不是野鸡医院 都是二甲三甲的正规公立 都带官网认证 事业单位认证的那种 搜索引擎基本都带 V 的
一般黑的爬网站内容,也没有每小时高并发爬一次全站的吧……

@lshero #43
别欺负我没干过搜索引擎 毕竟在熊厂干过
而且真搜索引擎 spider 我这有独立日志,包括 360 的真 spider,都是新增内容过来爬一下,每个独立搜索引擎一天也就 500-2000 左右的访问,分摊到 24 小时内非常零碎


@sobigfish #50
各种监控的 spider 我都已经分开了 各种盾我都没搞过
2018-05-13 10:26:36 +08:00
回复了 realpg 创建的主题 程序员 感觉,我可能发现了阿里云的一个秘密
2018.05.13 10:25
屏蔽了这些 IP 以后 又换了个 spider 来啦
换了 IP 换了 UA
134.73.7.0/24
"Mozilla/5.0 (compatible; MSIE 9.0; Windows NT 6.1; Trident/5.0); 360Spider(compatible; HaosouSpider; http://www.haosou.com/help/help_3_2.html)"

HaosouSpider 233333
2018-05-13 00:06:04 +08:00
回复了 realpg 创建的主题 程序员 感觉,我可能发现了阿里云的一个秘密
2018-05-13 00:04:28 +08:00
回复了 realpg 创建的主题 程序员 感觉,我可能发现了阿里云的一个秘密
@wdlth #27
附属 DD 医院无这个 IP 地址的爬虫记录
2018-05-12 23:57:06 +08:00
回复了 realpg 创建的主题 程序员 感觉,我可能发现了阿里云的一个秘密
@Applenice #15
每小时一次 刷全站的链接 后面数字自增 step2 两组 IP 分别刷奇数参数和偶数参数
一小时一次 刷完就拉倒 下一个小时继续来 并发数非常大,一秒几十个请求(对于超低配 ECS 算是流量巨大了)



@pupboss #14
@leaves7i #7
我这有个

XXXX 大学附属 AA 医院
XXXX 大学附属 BB 医院
XXXX 大学附属 CC 医院
XXXX 大学附属 DD 医院
XXXX 大学附属 EE 医院

其中,附属 DD 医院的领导不同意按流量计费的方式结算,要求一口价开发票,所以我给他们医院买的 5Mbps 带宽,其他四个都是按流量计费

现在 AA BB CC EE 医院都是这个 360spider 泛滥 DD 医院啥事儿没有……你说这是啥套路
2018-05-12 23:39:57 +08:00
回复了 realpg 创建的主题 程序员 感觉,我可能发现了阿里云的一个秘密
@leaves7i #7
xx 爬我网站 我网站很简单就
http://www.target.com/article_display/1http://www.target.com/article_display/9000
每小时都给我全站爬一遍图个啥……
2018-05-12 20:54:44 +08:00
回复了 kunluanbudang 创建的主题 Python Mysql 的 BINARY 数据类型, 适用于什么场合( 从经验上来说 ) ?
文件,二进制数据流。
1 ... 203  204  205  206  207  208  209  210  211  212 ... 433  
关于   ·   帮助文档   ·   博客   ·   API   ·   FAQ   ·   实用小工具   ·   2642 人在线   最高记录 6679   ·     Select Language
创意工作者们的社区
World is powered by solitude
VERSION: 3.9.8.5 · 52ms · UTC 15:46 · PVG 23:46 · LAX 07:46 · JFK 10:46
Developed with CodeLauncher
♥ Do have faith in what you're doing.