1
Livid MOD OP Request timeout for icmp_seq 4066
|
2
gonbo 2012-03-16 22:05:56 +08:00
v2ex要这么大的内存呀?。。。。你这个需求还不如直接租台服务器好了。
|
3
qhm123 2012-03-16 22:06:53 +08:00
团队?
|
5
cashplk 2012-03-16 22:08:01 +08:00
阿里云各种不靠谱,之前吐槽的人不少的。
|
6
lenmore 2012-03-16 22:10:21 +08:00
当小白鼠了……
|
7
Livid MOD OP Request timeout for icmp_seq 4528
|
9
Livid MOD OP Request timeout for icmp_seq 4723
|
10
lianghai 2012-03-16 22:16:44 +08:00
围观进展事件……
|
11
lianghai 2012-03-16 22:17:07 +08:00
……围观事件进展……
|
12
fanzeyi 2012-03-16 22:18:51 +08:00
每次看到国内的云都会想到@CMGS 叔的吐槽:
阿里云号称要升级磁盘,性能提高3-4倍,我觉得。。。难。。。而且,299一个月就这样的性能,好意思么?最特么坑爹的是,尼玛你一个卖VPS的,linux装个JB GUI啊,CentOS都是尼玛最大安装包yum grouplist一看全Group,坑爹么不是,吃内存还用不到。谁特么蛋逼用SSH玩扑克啊。 http://www.douban.com/note/187254979/ |
13
Elix 2012-03-16 22:22:31 +08:00
为什么会选择阿里云?
|
14
okidogi 2012-03-16 22:26:58 +08:00
之前还考虑从Linode转过去,现在阿,让我再想想。。。
|
16
hq5261984 2012-03-16 22:39:51 +08:00
转盛大吧。听说比阿里靠谱点。
|
17
hq5261984 2012-03-16 22:40:15 +08:00
华为的云不知道如何。
|
18
ksky 2012-03-16 22:50:07 +08:00 via iPhone
国内的云啊,还不如买个PC扔机房呢
|
19
colorday 2012-03-16 22:50:09 +08:00
干嘛升到8G,为嘛不买2台呢? 用两台做个负载均衡或分离前端和数据库,效果更好。
|
20
Livid MOD OP @colorday 一个运行中的应用,因为机器开始吃 swap 了,所以打算立刻升级到 8G。
本来以为几分钟就可以解决的事情(这不是云计算一直宣传的 sweet spot 么?),然后现在两个小时过去了…… |
21
colorday 2012-03-16 22:57:29 +08:00
怀疑资源不够用,分配没成功,重启试试。。。晚上升级悲剧,他们牛的技术晚上不值班的
|
22
Livid MOD OP |
23
Kai MOD 真•不靠谱
|
24
nihao 2012-03-16 23:11:41 +08:00
正在紧急处理,非常抱歉!我们会大力改进控制系统。
再次抱歉! |
26
Livid MOD OP 最新处理结果:
不能升级,机器恢复到 2.5G 状态继续运行…… |
30
CoX 2012-03-16 23:35:13 +08:00
折腾半天又回到起点,悲剧啊
|
31
freefcw 2012-03-16 23:51:01 +08:00
哎,技术明显的不到位啊。。。。
|
32
freefcw 2012-03-16 23:57:59 +08:00
不光技术不靠谱,而且整个团队,管理及态度都有问题。。。
|
33
Livid MOD OP 最新处理结果:
阿里云的同学们的各种反应还是非常及时和 helpful 的。 现在他们给了一台新的 8G 机器。 当然,运行环境得重新搭。数据只能自己从老的机器上复制过来了。 |
34
beenhero 2012-03-17 00:31:59 +08:00
叫什么云嘛,还是叫虚拟主机实在一点
|
35
Livid MOD OP 在新机器上重新把环境搭建了一遍,然后把数据从之前的旧机器上复制了过来。通过内网复制数据速度还不错,差不多 38MB/s。
只是,本来期望只用花 10 分钟就完成的一个升级,最后还是花了超过 6 个小时,其中有 2 个小时服务完全无法访问,也打乱了很多人的周末安排。 我不知道这样的情况是不是个案,但是如果你是一位创业者,希望从一个小的云主机套餐开始,等发展大了之后再升级到更大的套餐,那么实际情况恐怕不一定能那么平滑。 而在这个过程中,至少令人欣慰的是,虽然产品出了一些不给力的状况,但是阿里云的诸位工作人员的反馈速度还是挺及时的。谢谢。 |
36
zhuzhuor 2012-03-17 02:38:17 +08:00
linode的话,应该直接重启resize一下硬盘就行了?
|
37
linsk 2012-03-17 04:24:09 +08:00
换做没有影响力的小开发者,还有人鸟么?
|
38
too 2012-03-17 04:48:24 +08:00
云计算还是不够成熟的让人完全放心的
|
39
hilyjiang 2012-03-17 08:28:17 +08:00
@Livid
阿里云的弹性计算服务目前确实还不能平滑扩容,听他们售前说好像网站云计算可以。 @muxi @nihao 国内云计算确实还不够成熟,我们作为潜在预备用户,都期待他们把产品做好,都希望云计算产业在中国也能尽早成熟并大规模化。 但是楼上就像某位同学说的,在产品技术还不成熟之前,团队、管理和态度至少要先做起来,积极吸取各方用户的意见和反馈。产品目前存在什么问题,完全可以坦诚相告,并给出个计划解决问题的时间节点,大家心里有底自然不会吐槽。 最近常逛阿里云论坛,确实存在Livid说的垃圾帖子问题,各位版主估计也删得够累,但是垃圾帖子一周以来都一直存在,阿里云可曾想过解决这个问题? 另外,论坛上的问题帖子,经常长期得不到回复,又是什么原因? 论坛是客服与交流的地方,是不是表示阿里云不重视这块? 最后 @Livid 我很担心如果客户不是 Livid,muxi 和 nihao 又刚好不在 V2EX,反馈速度还会这么及时吗? |
40
kang 2012-03-17 08:32:36 +08:00
这样的云跟虚拟主机有什么区别?
|
41
zhuzhuor 2012-03-17 08:39:29 +08:00
貌似redhat不收授权费?
|
42
muxi 2012-03-17 09:23:22 +08:00
@hilyjiang 弹性云计算和网站云之前都是可以平滑升级的,这次出现这个情况是因为将一些业务做了整合,回归测试没有做到位,确实是我们的责任,因为调整的时间不长,最近没有用户使用这个功能,我们未能及时发现。
作为V2EX前100位用户和LIVID微博的粉丝,这个帖子一发出来我就看到了,我之所以到一个小时之后才回复,是因为我看到内部很多的邮件在追查此问题,在收到Livid的信息之前,实际上已经做了处理,我出来回答这个问题,是因为从反馈中来看一时半会儿无法根除,云计算是个非常庞大系统,定位一个问题并且解决没有那么容易。 从出问题到最后恢复到原来配置,花了近两个小时,而且没有及时告知客户,确实暴露了运营和客户服务的应急处理能力的不足,但我不同意楼上各位所说的态度有问题,我们确实第一时间在处理这个问题,没有及时告知客户是我们的责任。 不管这件事情是不是Livid,我们都会第一时间处理,在我介入此事之前,已经有数十封邮件都在追查这个问题,这个时候还没人认识Livid,凌晨1点半左右,运营部门的负责人还专门给我打过电话,咨询Livid是谁 |
43
nonozone 2012-03-17 09:34:32 +08:00
当每次关机需要5分钟,开机需要5分钟,重启也需要5分钟的时候,我就无力吐槽了...
安装的debian,果然桌面都安装了,问了客服服务器干嘛装这个,客服回答说有些用户基础比较差,希望能远程桌面什么的...我说windows这样可以理解,用户基础差谁会用Linux啊...好在那个时候客服响应速度还是蛮快的,小MM声音还蛮好听,蛮客气的,忍忍吧... 还有一次让我挺无语的,有一次客服打来电话,说系统要升级,技术人员需要首先检查一下俺们的系统又没有问题,需要我提供vps的管理员账号密码...俺顿时就黑线了...服务器的Root权限再怎么滴也都在你们那里啊,问我做毛线啊...反正最后还是给他们账号密码了。 由于域名的备案的问题,虽然还有4个多月到期也空着懒得用了...话说国外的有些vps速度作为网站访问起来也是不错的。只是,在运营方面,有时候不得不用国内主机,比如你想整个新浪微博的官方网站账号,不备案是不可以滴... |
46
muxi 2012-03-17 09:48:49 +08:00
@nonozone 5分钟你说的是那个字后台点重启按钮后转圈效果吧?实际上没这么长时间,只是保守的放了个时间在上面,下次你重启时候可以自己ping 监听一下试试
Linux镜像中放了桌面的包,是因为真的有很多用户不喜欢使用SSH登录,喜欢使用VNC连接,不过倒是可以提供一个精简的Linux安装包,方便用户的高级需求,确实也省点内存占用,磁盘一般都用不完,倒是不是太大的问题 @zhuzhuor Redhat是可以不付钱授权的,前提是,不能从官方下载软件,不能获得任何Redhat的相关技术支持,不能安装RedHat的二进制包,软件兼容性之类也不会保证,总之一句话:授权了其实就是买服务,自己折腾就不用付钱 |
47
nonozone 2012-03-17 09:51:58 +08:00
@muxi 就是试过了才这样说啊...我用国外的VPS,reboot以后,不过十几秒就可以登陆了,用了阿里云过了一两分钟都没法登陆,还真的要等后台显示已经运行起来才好...
当然可能现在的阿里云的技术团队比之前会好一些,并且看到现在linux默认的操作系统都是RH了吧,不像之前可以自己选择很多发行版。 |
48
muxi 2012-03-17 10:01:58 +08:00
@nonozone 这个可能跟阿里云使用系统是桌面版有关系,服务比较多,还有一个可能跟文件系统检测有关系,阿里云主机的文件系统检测是有点慢,是因为完全模拟硬件的原因,隔离性做的太好其实也挺悲剧,看来这个虚拟化得折中。
|
49
zhuzhuor 2012-03-17 10:27:52 +08:00
@muxi 额,我的意思是没有服务的redhat还不如centos呢,至少有community能维护下。到时redhat用centos的repo出了问题也没人能解决
aliyun可以弄个不带服务自己折腾的centos和带服务的redhat,当然redhat可以贵一些。amazon的ec2就是这样 |
50
amom 2012-03-17 10:40:11 +08:00
跟着吐槽阿里云,买了网站云,公司是北京的,被告知不能给备案,只能退款。为什么不在产品页面上加上说明!出来这么长时间了,很多备案和技术的文档还是简单的一点点,真差!非常差!
|
51
hilyjiang 2012-03-17 10:59:09 +08:00
|
52
hilyjiang 2012-03-17 11:01:29 +08:00
|
53
muxi 2012-03-17 11:02:31 +08:00
|
54
muxi 2012-03-17 11:18:02 +08:00
@hilyjiang 这个技术人员还真没有直接访问数据的权限,之前我在回答上面的问题提到过,隔离性做的太好也挺悲催的,目前所有本地存储数据,都是隔离存放的,做硬件层面的虚拟化。很多云计算公司没有做这一层的东西,只是做系统层面隔离,所有数据还是写到物理磁盘上,直接从母机就可以访问到所有的数据,和访问普通机器没啥区别,阿里云的主机文件系统也做到虚拟化里面去了,母机上访问不了虚拟机里面的数据,所以需要用户的密码能登入才能访问到数据。当然,这样做最大的问题就是文件读写性能会下降,其实不光是文件系统,CPU之类的也做了虚拟化处理,所以一个母机上,如果有其他用户CPU使用100%,并不会太影响其他的用户,所以整个io性能就没有直接使用那么高,好处就是做了尽可能的保证每个用户资源的稳定。
至于你说数据保密这个执行的是整个阿里集团的风控体系,阿里系的数据大部分都是跟钱有关,级别等同金融行业 |
55
nonozone 2012-03-17 11:18:13 +08:00
@hilyjiang 服务器托管在别人手里,完全杜绝技术人员访问数据这本来就不大现实,并且基本上都是web应用,说数据要多么多么安全那也么必要。我只是觉得,在检测服务器升级的时候,阿里云应该是有root权限的,根本就不需要经过我这里啊,这就类似一个系统管理员问我要一个普通user权限一样...难道说跟windows一样,或者说完全虚拟化了,没有我的权限他们技术人眼压根动不了服务器?从安全角度和管理角度这都是不可能的吧...
|
56
muxi 2012-03-17 11:22:05 +08:00 1
|
58
hilyjiang 2012-03-17 11:43:44 +08:00
|
59
muxi 2012-03-17 12:12:12 +08:00 1
@hilyjiang 母机上的确可以通过工具访问虚拟机内部文件,前提是需要有虚拟机的root密码,目前root密码是在创建虚拟机的时候随机生成的,而且不保存,在Windows上玩过虚拟机的人都知道,实际上你给虚拟机分配的磁盘空间,对于母机来说,就是一个文件,这个可能数十G大小,对于阿里云主机来说,除了这个数十G大小的虚拟磁盘,还有一个云存储,如果你用fdisk或者df之类的命令去查看的话,应该能看到两个盘挂在那里,空间大的是云存储,空间小的是本地存储(虚拟磁盘)
云存储的可用性可以达到99.99%,可以保证数据不丢,对于本地存储使用的是镜像备份,云存储有自己的策略保证数据安全性,可以把数据放到云存储这个分区,即使你的主机哪天起不来了或者真的磁盘毁了数据也是可以恢复 |
60
hilyjiang 2012-03-17 12:54:20 +08:00
@muxi 刚才看了楼上同学给的链接里的评测,如果属实,CPU和存储的性能真的降得有些过份呀。。
http://www.douban.com/note/187254979/ http://d.pr/MVYb 盛大云4G,性能 http://d.pr/Uwx 盛大云1G,性能 http://d.pr/ZZtd 阿里云1.5G,性能 http://d.pr/XZ8P linode 512M,性能 |
62
likuku 2012-03-17 13:02:58 +08:00
国内企业都想快速捞快钱,谁管你客户利益和体验?
长远?明天是否活着都是未知数,没人考虑这些。 |
63
hilyjiang 2012-03-17 13:14:00 +08:00
纠正下,阿里云的CPU性能还是不错的,2 核 Xeon 2.26G 跟 Linode 的 4 核 Xeon L5520 2.27GHz,少个 50% 是正常的哈,比起盛大的 2 核 AMD Opteron 6172 2.1G 要强不少。
存储性能方面,单看 File Copy 1024 bufsize 2000 maxblocks 这项得分: Linode 得分 681.9 盛大 得分 228.3 阿里云 得分 101.7 Linode 没有使用独立存储,所以存储性能上是最优的。 盛大应该是用了独立网络存储设备,存储性能有些下降。 而阿里云估计也是在独立存储设备上搞了存储虚拟化,存储性能就更低了。 听楼上 @fanzeyi 说阿里云要升级存储来提高性能,请问下 @muxi,可否透露下打算怎么升级呢? |
66
muxi 2012-03-17 14:50:13 +08:00
CPU:Intel(R) Xeon(R) CPU E5450 @ 3.00GHz 内存: 1.5G 测试工具: UnixBench 5.1.3 http://byte-unixbench.googlecode.com/files/UnixBench5.1.3.tgz |
67
hilyjiang 2012-03-17 16:13:33 +08:00
@muxi 你这个是双路共 8 核的 U 吧,CPU 运算性能接近之前那个测评的 5 倍了。
File Copy 1024 bufsize 2000 maxblocks 这项 RESULT 98614.4 已经超过盛大的 61008.0(2 core U) 和 51415.0(1 core U)了,估计是受 U 核心多的影响? 其它几项数据和盛大1G的评分还是有很大差距,不知道是因为测试工具版本变了,导致测试方式不一样了还是咋滴。不过不同版本的 RESULT 数据应该不会差太多吧。 |
68
muxi 2012-03-17 16:32:26 +08:00
@hilyjiang
top - 16:31:30 up 14 days, 18:25, 2 users, load average: 0.30, 0.13, 0.04 Tasks: 153 total, 2 running, 151 sleeping, 0 stopped, 0 zombie Cpu0 : 2.3%us, 0.7%sy, 0.0%ni, 96.3%id, 0.4%wa, 0.0%hi, 0.2%si, 0.0%st Cpu1 : 0.4%us, 0.3%sy, 0.0%ni, 99.2%id, 0.0%wa, 0.0%hi, 0.1%si, 0.0%st Cpu2 : 0.4%us, 0.3%sy, 0.0%ni, 99.1%id, 0.0%wa, 0.2%hi, 0.1%si, 0.0%st Cpu3 : 0.4%us, 0.4%sy, 0.0%ni, 99.1%id, 0.0%wa, 0.1%hi, 0.1%si, 0.0%st 不是8核,4核 |
69
muxi 2012-03-17 16:54:47 +08:00
@hilyjiang 为了提现公平我找了一台线上在售的主机,CPU依然是Intel(R) Xeon(R) CPU E5450 @ 3.00GHz 内存: 1.5G 。 unixbech 4.1.0版重新测试了 5.1版加入了多核测试支持,导致分数偏高 测试软件下载地址:http://soft.vpser.net/test/unixbench/unixbench-4.1.0-wht.tar.gz 这下数据有了可比性 和 http://www.douban.com/note/187254979/ 这篇文章提到的各个数据可以做下全面的对比,孰优孰劣,各位看官自己斟酌 |
70
hilyjiang 2012-03-17 17:44:52 +08:00
@muxi 我整理了下最终得分(综合得分):
* 盛大云4G 119.7 * 盛大云1G 85.4 * 阿里云1.5G 61.5=>173.6 * Linode 512M 239.2 阿里云的得分从原来 61.5 分跳到现在的 173.6 分,相当先进呀。 先别高兴,下面还是来看看各项具体数据吧,到底是哪里提升了。。。 CPU 运算能力 Dhrystone 2 using register variables 这项得分: * 盛大云4G 223.8 * 盛大云1G 112.4 * 阿里云1.5G 300.1=>483.2 (E5450真不是盖的) * Linode 512M 646.3 可惜离开寄存器变量马上就弱下来了,看 Execl Throughput 这项得分: * 盛大云4G 123.1 * 盛大云1G 90.8 * 阿里云1.5G 29.2=>28.8 (还是这么低呀,CPU再强也用不起来) * Linode 512M 198.3 存储读写能力 File Copy 1024 bufsize 2000 maxblocks 这项得分: * 盛大云4G 228.3 * 盛大云1G 192.4 * 阿里云1.5G 101.7=>483.2 (真的有4倍的提升) * Linode 512M 681.9 再看看 Shell Scripts (8 concurrent) 这项的数据: * 盛大云4G 138.7 * 盛大云1G 85.5 * 阿里云1.5G 35.2=>44.1 (这个样子,CPU再强有神马用?) * Linode 512M 230.7 唉。。CPU硬件是不错呀,可惜威力没有发挥出来,希望阿里云能够尽快把短板补上来哈,期待下一次的惊喜。 另外,把 Linode 这种物理机的存储摆在一起比较确实不太公平呵呵,它的数据仅供作为云架构及虚拟化的损耗的参考。 |
72
amom 2012-03-17 19:39:23 +08:00
@muxi 天朝环境的确这样,所以备案应该是产品的一部分,阿里云如果暂时不能提供某地的就应该说明,后续可以提供了再更新罢了。估计这个100字之内完全可以解释明白,但阿里现在没有做。我猜像我这样的例子不少,阿里云宁肯花大量的时间消耗人力来沟通也不愿意花1小时在产品上说明一下。这就是阿里云的服务!
|
74
dongdongbao 2012-03-18 00:53:25 +08:00
感谢大家的建议,上面的问题都已经采集
|
75
hilyjiang 2012-03-18 09:48:34 +08:00
@dongdongbao @muxi @nonozone 说的这个确实会比较麻烦,最好能在用户的控制面板上做个类似于临时授权的工具,如果遇到问题,只需要打开这个临时授权的开关,让技术员免登录就能进入系统,服务结束关再关掉这个开关。具体要怎么实现,我想阿里不缺有才之人哈哈,方式也有多种多样。
|
76
Alpha 2012-03-23 23:45:06 +08:00
阿里云再次宕机
“ 【重要通知】 由于后台控制管理系统进行调整,暂停云服务器升级功能,本功能将于3月27日恢复,给您造成不便,敬请谅解!” 估计是升级导致服务中断了。 |
78
yishenggudou 2012-03-27 23:01:55 +08:00
@hilyjiang 对啊 不是说只是升级,暂时不能购买服务
|