从Google日历宕机事件学到的教训
2010-10-18 15:22出处:51cto作者:黄永兵编译【我要评论】
[导读]和许多小公司一样,我们使用Google共享我们的日历。
和许多小公司一样,我们使用Google共享我们的日历。不可否认,Google日历服务很好用,它能和电子邮件及同步服务器很好地集成,并且最重要的是,它是免费的,正因为如此,Google日历拥有上百万忠实用户,按常理来说它不会发生大故障,因为影响的用户太多了,但截至上周二,Google的日历服务中断了8天,时间之长让人咋舌,也让许多用户愤怒,虽然现在事情已经过去,但我们应该从这起非比寻常的事故中学到什么教训呢?
这起事故让0.2%的Google日历用户中断了多天的访问,首先我们看看Google在这起事故中的处理方法,然后我们总结一下这起事故的教训。
Peter Sandman开发了一种方法预测人们在不愉快事件中的反应,越高表示风险越大,对局势的控制难度越大。这就是为什么我们更担心被鲨鱼袭击,而不是被烤箱电死的原因,即使我们被烤箱电死的可能性要高出30倍。
使用云服务时,用户是看不到服务器的,因此他们是无法运行诊断程序的,也不能跑到大厅叫IT人员来救援,即使经验丰富的用户也无法准确地知道恢复数据需要多少时间,甚至连该做些什么都不知道,服务关闭时,用户看到的是一个空白页,不管这是暂时的,还是会造成数据完全丢失,用户都帮不上忙。
Google没有及时调配合理的资源修复这起事故,导致用户抱怨非常多,此外,一些用户使用的第三方产品也受到波及,而Google对此毫无解决办法,使得事态火上加油,Google也未向用户及时发出通知,因此用户的情绪失控是太正常不过了。
本文导航>>
- 1.解析Google宕机的处理方法
- 2.你的团队可以学到什么