阿里云、腾讯云们的故障 阻挡不了云化的步伐
今年,对大型云计算服务商来说并不是好过的一年。
一方面,企业上云、政务上云成为一种大趋势,数据化被越来越多的人接受,云服务市场扩大,营收不断增加。另一方面,价格战下,小企业步履维艰,大企业占据大份额市场,但频频出现崩溃的问题。
云服务巨头们多次服务崩溃
7月24日上午,腾讯云服务今日出现异常宕机事故,导致部分用户无法访问微信接口,业务崩溃。官方称,目前监控到广州区域部分用户资源访问失败,初步确定运营商光缆中断,运营商反馈预计上午恢复。约两个小时后,中午12:10,腾讯云在微博发布通知,表示“广州区域部分用户资源访问失败、控制台登录异常问题已解决。”并解释说,“故障已确定是运营商光缆中断所致”。
今天,腾讯云在官方微博、微信,同步发表了《关于7月24日腾讯云故障的进一步声明》,进一步对昨日的故障问题进行说明。
实际上,腾讯云已经是本月第三家出现云服务故障的企业,全球云服务商的巨头们AWS、谷歌云、阿里云都未能幸免,而微软在去年也出现了问题。
2018年1月18日,谷歌自动化失效引起停运了93分钟。
2018年2月28日,AWS因一条错误指令引起宕机。
2018年6月28日,阿里云官网控制台和使用部分产品功能出现问题;
2018年7月17日,AWS管理控制台间歇性失灵;
2018年7月18日,谷歌云平台全局负载均衡服务发生中断;
企业上云不应受影响
尽管云服务商的头部企业出现了一些问题,但企业上云的不应该受到影响,数据化仍然大势所趋,问题的关键在于风险的应对和故障防控。
云计算是一种按需分配的IT资源供给方式,可以满足对IT资源的“拿来就能用”,“想要就能有”的需求。云计算中的虚拟化技术带来“弹性、灵活、安全、低成本”的特性,使“上云是常态,不上云是例外”成为共识。
云计算的作用是什么?可以总结为三点:降低成本、使企业快速进入市场、提高效率。首先,通过云计算,可以把分散的、低效的、低水平的数据中心逐步淘汰,让子公司的IT变得不再重要,因而大大降低运维成本和使用成本。其次,通过云计算,可以让大家协同在一个社会化的IT平台,从而让由客户驱动的企业创新成为可能。市场有什么动态,企业可以马上做出反应,并快速进入市场。最后,云计算还可以提高企业效率。大家可以在一个平台上协同工作,这个平台是一个基于供应链的平台,一个基于大协作的平台,一个基于创新的平台。企业的内部和外部,不同企业,甚至不同行业都可以基于这个平台合作。
对于中国企业而言,云计算有着深远的意义。企业需要进入云计算时代,从而利用新的技术,新的模式,提高竞争力。
应对云服务故障 云服务商与企业要共同努力
服务器宕机多以预防和监控为主,要做到万无一失,除了云服务商在技术和服务方面的完善和提高以外,客户自己也要时刻做好万全准备,云主机客户和云服务提供商之间从来都应该是伙伴和战友的关系,双剑合璧才能真正彰显云计算的威力。
企业:
在主机选购上,目前云主机战场诸侯争霸,在价格战的大范围下,各大企业主打价格牌,这点也确实起到了行业洗牌,吸引客户的作用。但是,宕机故障带来的损失在无形中其实已经抬高了企业成本。因此,主机选购不能人云亦云,贪图小利。云服务不能一蹴而就,真正好用、耐用的主机才是长久、可靠的选择。
采用多云战略。多云解决方案提供多重数据备份,企业可以在不同云端进行数据备份,有效防止数据丢失,并且减少宕机时间。数据丢失和宕机会导致企业遭受重大的财务影响,多云也因此得到加速发展。
选择多家云供应商,不仅可以从中挑选使用他们性价比最高的服务,企业也不必依赖于唯一的供应商。如果某家供应商服务昂贵,企业完全可以使用其他服务供应商的服务进行替代。
云服务商:
建设容灾系统,以减少因意外发生导致的业务中断、数据丢失等严重后果。在容灾平台的搭建中,除了灾备中经常提及的RPO、RTO之外,更应该关注“灾难完整性”,要求容灾系统需要有比较全面的灾难完备性,能够预防各种灾难情况。
让用户实时关注站点的可用性、响应时间、服务器资源等指标,提供智能多样的报警方式、信息统计,八度网络云监控系统在业界广受好评。云监控为客户提供了全方位的监控体验,任何系统异常都能及时通知到用户(短信通知、电话语音通知),及时处理异常,从而提高用户产品的可用性。
建立危机处理机制,为故障出现准备多套预案。当宕机等问题出现时,及时给予客户通知,在最短的时间内处理问题,减少客户损失,提供行之有效的善后处理方案。
企业未来的核心竞争力,依靠的就是数据能力,企业云存储服务,是构建这项能力的最基本的条件。企业应学会正确应用云服务,实现信息的共享、协作和平等,管理变得更加的扁平化,让互联网的思维产业延伸到企业的生产、管理和销售等方方面面。
责任编辑:玄文成