服务热线:

4000346119

摄像头安装,监控维保,监控维修 北京监控安装公司

可根据客户不同的需要,提供个性化解决方案

新闻资讯
新闻资讯
联系我们

电话: 4000346119

邮箱: 506665119@qq.com

地址: 北京通州区新华北路117号

监控知识

北京网络布线公司指出 大部分数据中心故障都源于人为灾难

作者:亿杰监控安装点击: 发布时间:2020-08-02

北京网络布线公司指出,大多数数据中心故障都是由人为灾难造成的。

数据中心故障是不可避免的。经过分析,大多数根本原因是人为因素造成的,即人为灾害占所有故障的70%以上。一方面,人们正在享受自己设计的数据中心给工作和生活带来的便利;另一方面,他们也遭受成长的痛苦,并不断为自己的错误付出代价。事实上,不仅仅是在数据中心领域,在数百年的历史中,许多灾难都来自人为灾难。

大多数数据中心故障都是由人为灾难造成的。

只要有人参与任何活动,就不可避免地存在人为错误的可能性,机器出错的概率比人类低得多。从长远来看,最近几次主要的网络中断都与人有关。2017年2月28日晚上8: 39,百度手机搜索失败,搜索请求无法显示结果。下午9时21分复会,持续42分钟。在这次失败中,数亿手机用户的搜索受到了影响。事后,工业和信息化部立即紧急约谈百度公司,了解相关情况,并要求互联网公司尽最大努力防止类似问题再次发生。该故障源于软件更新中导致服务器停止服务的BUG(漏洞)。数据中心运行着大量的软件系统,软件bug不可避免地存在。即使单元能够达到CMM5级别,代码缺陷率也不会低于1/1000,也就是说,在1000行代码中至少有一个错误。对于拥有数千万行代码的软件系统来说,错误的数量是可以想象的。当然,普通人不会恶意给这些软件系统添加漏洞。其中大多数是由无意识、缺乏经验和注意力不集中造成的。然而,这是人为因素造成的,说白了,是人为的。最近几天,全球最大的公共云服务提供商亚马逊的应用服务经历了几个小时的失败。

失败的原因是AWS S3(云存储)团队在调试期间输入了一个错误指令,该指令本应删除少量S3计费流程服务器,但最终意外删除了大量服务器。违反此服务级别协议可能会导致数百万甚至数千万美元的损失,这是另一个严重的人为失误。回顾亚马逊从2011年至今的七次大规模失败,大部分原因也是人类造成的。刚才,大量微软Xbox、Skype和Outlook用户抱怨他们的帐户无法登录,表明这些帐户不存在。这是另一个影响全球的大规模登录问题。虽然微软还没有公布原因,但它已经承认存在问题,这可能是人为因素造成的。因此,一旦有人加入更多的数据中心,他们中的大多数都是不可靠的。

与无人值守数据中心和有人值守数据中心相比, 北京网络布线公司不难发现,虽然无人值守数据中心在安装设备时往往人手不足,但整体运行稳定性却远远高于有人值守数据中心。在这些无人数据中心首次投入使用后,很少有人修改或调整系统运行的各种参数,以允许数据中心独立运行。设备按照预定的程序指令运行,很少出错。相反,在那些操作和维护人员强大的数据中心,他们经常会遇到这样或那样的故障,这些故障大多与人为因素有关。许多数据中心已经意识到这一点,所以他们把数据中心的控制权放在技术力量最强的总部,不容易做出改变。例如,由于业务部署需要进行变更,变更程序和申请流程都非常严格。通常需要经过设备制造商的确认、实验网络的模拟和高层领导的批准,然后在实施之前对方案进行充分的讨论。因此,数据中心的业务运行非常稳定,几乎没有错误。许多数据中心非常喜欢软件定义的数据中心。希望整个数据中心能够由软件统一控制和管理,所有的控制权能够由几个技术实力雄厚的老专家集中控制,以防止其他人随意更改,造成一些未知的故障。或将控制权直接移交给软件,并将人工操作和方案移交给软件设备执行。设备出错的概率远小于人出错的概率。该软件可以自行管理整个数据中心,不仅可以降低人工成本,还可以降低人为失误的概率。

所谓“成功是小何,失败是次要的”。人是数据中心活动中最重要的因素。没有人参与他们来自的数据中心。然而,人们也给数据中心的发展带来了麻烦。要拥有一个运行良好的数据中心,必须关注运行系统或与之交互的人员。如果数据中心能够投入时间,在员工的技术水平、培训、维护和运营方面做出审慎的决策,那么大多数灾难通常都是可以避免的,并且数据中心可以长期稳定运行。许多对数据中心的攻击都利用了人类安全意识的缺乏,系统被攻破了。例如,索尼在2011年3月遭到黑客攻击,造成了有史以来最严重的消费者数据“泄露”。超过7000万玩家的电子邮件地址、密码、信用卡号和其他数据被盗。泄密的原因是索尼负责信息安全的员工没有及时修补运行过时的阿帕奇网络服务器软件的服务器,也没有安装防火墙。结果,入口被打开了,入侵者进入了房间。黑客很容易窃取内部数据。因此,数据中心需要有效管理和标准化实施ITIL和信息技术服务,以有效减少运营和维护中的人为隐患。数据中心管理应该关注人,而不是设备。

不难看出,大多数数据中心故障都是由人为灾难造成的。运行中的数据中心应减少人类参与的机会,并全面管理和评估人类行为。“三分技术,七分管理”,大量事实表明,数据中心的好坏评价标准是由管理水平决定的,而管理主要是针对运营商的。只有加强运行维护人员的管理,提高他们的技能,才能减少人为失误的机会,避免人为灾难。数据中心是一个非常复杂的信息技术系统,不可避免地会导致这样或那样的问题,从而导致故障。如果能通过有效的管理有效减少人为灾害的因素,数据中心的运行稳定性将会得到有效的提高。


相关标签:
新闻资讯
相关产品
在线客服
联系方式

热线电话

4000346119

上班时间

周一到周五

公司电话

4000346119

二维码
线