数据中心的运维五大要求
当前位置:以往代写 > 大数据教程 >数据中心的运维五大要求
2019-06-14

数据中心的运维五大要求

  随着数据中心建设规模的不断扩大,新技术的层出不穷,数据中心变得越来越复杂。大型数据中心往往是由很多规模庞大的集群系统组成,其运维工作需要具备方方面面的知识,包括硬件、网络、服务器、存储、安全以及业务上的东西,需要上下打通地去做运维工作。
  当一个数据中心的规模非常大,面临的挑战和问题也比较超前,很多在小环境小体系下不是问题的问题在这样的规模下也就凸显出来了,所以要做好大型数据中心的运维工作,对整个数据中心技术体系的系统学习就要花费比较长的时间,只有对这个数据中心整体非常了解,才能有针对性地制定一些运维方案,甚至可以二次开发一些监控运维软件,对整个数据中心进行有效管理与监控,提升整个数据中心的运行效率、减少故障的发生,从而将运维工作推向新的高度。一个大型的数据中心内部往往都包含了很多小系统,运维工作都是围绕着这些具体的应用系统展开的,具体的可以分为基础运维管理、日常业务运维、网络、服务器、存储、安全六大部分,本文就来说一说一般大型的数据中心应该具备的哪些运维方法能力和要求。

数据中心的运维五大要求_数据中心_大数据_服务器_课课家
  从数据中心的日常业务运维方面考虑,则主要有资源、机器分配、资源使用、网络吞吐、故障恢复、备份应用,集群搭建、流量,压力,迁移扩容,升级、上下级业务关联情况、资源利用率、异常处理、应急预案等等。这些日常运维工作实际上要花费大量的人力和时间,是运维工作的主体,也最烦琐,但却最不能体现业绩的部分。一个数据中心能够长久安全稳定运行,就是靠这些日常的工作积累,只有平时注意这些细微的变化,才能不断优化。压力测试、软件升级、业务部署、异常处理等几乎成为了运维工作的日常必修课,只有将这些工作做好,才能避免出现大的故障,并能够快速部署新的业务,根据资源使用情况及时扩容设备。数据中心作为IT服务的物理载体,客户对IT服务实时性、安全性、可靠性等的要求最终将内化为对数据中心运维管理的要求。数据中心运维对象涉及种类比较多,从供配电设施到IT设备、到应用系统、到各类人员,这无疑要求数据中心的运维管理应能适应所有的管理对象。如果该数据中心要通过一些专业认证,或为一些特殊行业提供IT服务,其运维管理必须符合相关标准与行业规范。以下列举了部分运维管理方面的要求。
  1.运维管理服务化的要求
  随着客户对IT系统依赖程度的增加,数据中心的工作质量将直接影响到客户的业务、市场甚至是公司形象等。由于信息系统宕机导致企业一天遭受数千万元的损失,甚至被监管机构处罚的例子屡见不鲜。这个变化使得数据中心的运维管理逐渐浮出水面,数据中心运维管理团队已从原来的机房管理者演变成了IT服务的提供者。如何定义数据中心工作与服务的关系,如何建立与客户之间的服务水平协议,如何快速地支持客户业务的IT服务需求,如何规划好IT系统建设更好地为业务部门提供发展的动力等,均成为数据中心运维管理规划过程中不可或缺的一部分。

如何定义数据中心工作与服务的关系,如何建立与客户之间的服务水平协议,如何快速地支持客户业务的IT服务需求,如何规划好IT系统建设更好地为业务部门提供发展的动力等,均成为数据中心运维管理规划过程中不可或缺的一部分。
  2.管理制度体系化的要求
  数据中心作为一个新生事物,对其运维管理也是近年才兴起的一门学科。因此数据中心的运维管理制度主要靠运维人员利用以往的经验,并总结数据中心管理过程中的经验教训而逐渐建立起来的。这样的管理制度能满足一定的管理要求,但由于没有一个标准的指导,而且在搭建初期主要遵循从下而上的方式,从而导致整个制度的体系化不足。这种体系化不足的缺陷会导致企业管理出现零散化,也就是当组织面临一个新的工作或管理要求时就会产生一个新的制度,而该制度与原有制度之间的关系则难以进行整合,最终会使管理者无所适从。
  3.信息安全的要求
  随着技术的广泛应用与信息的转型,信息对机构来说,已经变得与土地、人力与资金等传统资源同等重要。另外,随着信息面临的威胁逐年增加,如病毒、钓鱼网站、间谍软件、错误操作、越权使用、人员安全等,作为承载客户信息系统运行的数据中心而言,信息安全绝对是其运维管理的重要要求。安全就是十几个小项:攻击保护、升级备份、抓BUG/找BUG、脚本工具、数据安全、服务巡检等项目,其中每一项拿出来其实都包含很多的内容。比如说到攻击与保护,这个主要指的是防止外来的异常入侵者对数据中心发起的恶意和无意攻击,恶意攻击就是有人故意的使用各种攻击方法,进入到数据中心内部,将重要的数据窃取或者破坏,达到其不可告人的目的。也有的是无意的攻击,因为整个数据中心是要与外界保持互联互通的,运行是动态的,变化的,不可避免会有一些异常流量攻击数据中心,有时甚至来自于数据中心内部,比如某些服务器中毒,或者硬件故障,构造出了环路,异常流量等网络故障,这些都会影响到数据中心的运行,所以如何做好数据中心的攻击与保护是一个很大的题目,这并不是在数据中心里部署几台安全设备就能解决的,需要对整个数据中心进行全面的统一规划,并有针对性地部署一些安全防护措施,而且随着各种黑客技术的提升,安全防护措施也要不断提升,这是一个不断学习与完善的过程,只要数据中心还在运行,这个完善就不会停止。为了方便运维,也要做好一些执行脚本,以便在出现突发事件时,能够快速处理问题。比如一个数据中心的业务出现异常,为了快速恢复业务,需要将路由进行调整,将流量全部引到其它的数据中心,这就需要在核心路由器上进行调整,这时有个现成的脚本就可以自动执行,达到快速切换的目的。数据中心还应该准备很多其它工作的脚本,以便紧急的时候快速使用。

#p#分页标题#e#

为了方便运维,也要做好一些执行脚本,以便在出现突发事件时,能够快速处理问题。比如一个数据中心的业务出现异常,为了快速恢复业务,需要将路由进行调整,将流量全部引到其它的数据中心,这就需要在核心路由器上进行调整,这时有个现成的脚本就可以自动执行,达到快速切换的目的。数据中心还应该准备很多其它工作的脚本,以便紧急的时候快速使用。
  4.管理制度测量的要求
  随着IT技术应用的广泛和深入,以及精细化管理的提出,量化管理已成为许多成熟企业努力的方向。作为直接支撑IT服务的数据中心来说,也需要导入这种量化的管理方式,用数字来说话。这就要求数据中心在构建运维管理体系时,要考虑将来的测量需求,并在流程中预留这些测量点,最后通过报表、记录的输出,达到对该制度进行测量的要求。
  5.全面质量管理的要求
  数据中心运维管理的目标之一就是要保障用户IT服务的按质提供,该目标又可细分成基础设施的可用性、IT设备的可用性、配置管理的有效性、人员对设备操作的熟练程度、服务商管理的到位程度等多个方面。由于数据中心与制造企业不同,上述服务性的工作毕竟无法像工业产品那样容易衡量质量,而且就算是在检查的时候服务质量是合格的,也无法确保在需要该服务时服务质量也是合格的。因此,如何做好全面的质量管理是数据中心运维管理的主要内容。
  通过上面的分析您一定很惊讶,原来数据中心运维包含这么多内容,而且每一项包含的内容说起来都不那么简单,也涉及很多的技术知识。一个数据中心能否稳定运行,能够高效运行,运维是关键。只有将这些运维工作很好地部署和执行下去,数据中心才能长期稳定。更多内容就在课课家教育!

    关键字:

在线提交作业