软题库 培训课程
当前位置:信管网 >> 其它资料 >> 文章内容
金融风暴下如何进行IT运维成本管理
来源:信管网 2012年02月29日 【所有评论 分享到微信

 
0引言
 由于受金融风暴的影响,越来越多的企业濒临倒闭甚至破产。全球经济下跌,已是不争的事实。如何在金融风暴中逆水行舟并稳步前进,成为所有人关注的焦点。不难分析出,竞争力从哲学上理解,就是指“赚到手的远远高过花掉的”。
把这个哲理细分,不难理解出所谓赚到的,在经销中就体现为销量、营业额,当销量及营业额大幅度提高,那么利润也应提高。同时这个假设受到一个条件的制约,那就是在做好开源的同时,一定必不可少的做好节流。
成本控制是企业管理活动中最永恒的主题,成本控制的直接结果是降低成本,增加利润,从而提升企业管理水平,增强企业核心竞争力。
1 什么是IT运维管理
 IT运维管理是指为保障IT系统与业务正常、安全、有效运行而采取的管理活动,包括IT运行管理和IT维护管理。IT运维成本管理,即IT系统运行和维护的成本管理。在企业IT管理的早期,更侧重于对网络、硬件等设备的管理。
那时的IT管理就是通过某种方式对网络进行管理,使网络能正常高效地运行。早期的这种IT管理是NSM的阶段,主要的面向目标就是底层的基础网络设备。
NSM系统是对网络中的底层设备进行实时的、统一的监控,当网络中出现了问题或者即将出现问题的时候,NSM向网络管理者提出故障定位和报警,这样做无疑大大方便了网络管理员的工作。但是,NSM系统对于网络上运行的各种业务系统以及业务系统的用户只能做一些简单的管理。
这个时期的IT管理,可称之为网络运维管理阶段,这时候的IT管理人员称之为网络管理员,简称网管。随着企业IT系统的日益成熟和复杂,企业的关注点已从单点管理到综合管理角度的转变,从关注单一网络到对业务系统的关注。原因在于,越来越多的企业意识到,业务系统涉及环节逐渐增多,单一的网络运
维管理已经不足以满足管理需求,需要落实如何保障业务系统的各个环节。在满足对IT资源进行统一管理、降低运行成本、提高突发事件应对能力、提高服务质量和效率的基础上,更需要保障业务系统的正常运行,才可以保证IT投资的价值体现。
同时,在国内IT管理领域,伴随着用户IT规模的扩大、IT技术的发展和用户需求的提高,原有的网络管理系统已经远远不能满足当前的用户需求。因此,当前国内用户迫切需要一个能够对整个IT资源进行统一管理,解决IT资源所面临的种种困难,同时更要做到对业务系统有效保障并提出改进意见的平台。
在这样一个前提下,IT运维管理的概念和产品被国内知名的网络运维管理厂商率先推出。可以说,它的出现就是对当前用户需求的一种有效诠释。这个时期的IT管理,被称之为IT运维管理,这时候的IT管理人员称之为IT运维人员。
IT运维成本产生于哪些方面?一个企业的IT系统是由三部分组成:第一部分是企业的服务器和个人电脑等;第二部是网络设备如交换机、Hub等;第三部分是企业业务应用系统,比如ERP系统、HR和CRM系统等。
按照对IT运维的范围定义,所包含的主要内容可归纳为如下7个方面:桌面系统维护、网络系统维护、网络安全系统维护、服务器维护、软件系统维护、机房环境维护和IT固定资产管理服务。除此之外,还有对IT运维人员的人力成本,这往往是被大多数IT经理所忽视的,但是却相当重要的一部分。
2 IT运维和企业业务之间的关系
 IT运维与企业业务是相辅相成的关系。随着业务的不断扩展和信息化的持续深入,企业IT系统越来越复杂。业务对IT系统的依赖程度也越来越紧密,IT系统的任何波动,都会直接影响到业务的正常开展。通过运维系统在业务信息的采集、加工、分析、处理、存储、传输及检测等过程中的管理,可以实
现便捷、易用、高效、安全、可靠、集约、简化等目标,实现信息基础设施的结构清晰、层次简单、统一开放、互联可靠以及灵活扩展,使IT系统能够真正友好地辅助管理者进行科学决策、在线控制和规划预测,最终达到绿色IT的目标。
而同时,IT运维部门在企业内部充当服务部门,而并非盈利部门,所以当出现金融危机,企业利润无法达标的时候,IT运维成本往往成为第一个被缩减的项目之一。很多企业都已完成IT系统的建设工作,但是缺乏有效的IT运维体系,导致IT运维成本不但已经居高不下,而且逐年增加的趋势也非常明显。
通过对运维成本的本质分析,我们发现许多企业至今在运维成本方面缺乏统一标准:一方面是运维成本紧张,系统维护不到位的现象;另一方面又存在着对运维成本控制不力,乱用和占用严重的现象。这不仅大大影响到企业利润,更为企业产品质量埋下隐患,IT运维反而成为一颗定时炸弹,随时引爆企业形象危机。
3 影响IT运维成本的因素
 企业对IT运维部门的要求就是以尽可能少的成本来达到IT系统的高可用性,为企业业务保驾护航。但是,我们发现在保障高可用性的同时,有几个因素成为降低IT运维成本的“拦路虎”。
(1)高昂的来电响应式运维成本。在运维过程中,只有当故障已经发生并已造成影响时才能发现和着手处理。这种被动的、孤立的、分散的救火式运维管理模式,不但使IT运维人员终日忙碌,也使运维服务质量很难提高,响应速度过慢,对于业务影响时间过长,导致运维人员和业务部门的满意度都不高。
传统的故障来电响应式的IT运维模式不但成本高、响应模式被动,而且局限性已显露无余,往往只能做到“头痛治头、脚痛治脚”的分割式管理。在资金充足的情况下,许多救火式的成本浪费会被隐藏起来。但当经济不景气时,问题就会无处藏身,救火式的被动运维往往是成本高居不下的根本原因。
(2)缺乏规范化运维流程,导致运维成本控制不力。在运维流程上,很多企业没有明确的事件升级标准,即满足怎样的条件后,事件必须从一线转到二线支持工程师,再转到资深工程师处理;没有事件的限级标准,没有建立优先级和解决时限的标准,不能保证事件解决的实效性和资源的有效利用;
事件产生后没有明确而唯一的责任人,从而缺乏对事件监控和跟踪机制。这些都使事件、服务请求处理过程中没有形成严格的闭环管理,也没有建立明确的重大或紧急事件处理流程,从而不能保证在事件发生后及时处理,造成许多隐性的流程处理成本。
(3)缺乏明确的运维成本标准,乱占乱用现象严重。业务部门经常会提出一些导致运维成本增加的要求,比如硬件升级、软件维护与培训等。CIO在面对这些内部需求时往往是承担着支出责任,而高层认为谁支出谁负责,这样非IT的业务部门没有为IT运维产生的成本买单,而是由IT部门实际承担了来自业务需求的IT成本。
随着IT与业务的不断融合,由于IT成本核算错位,所有的支出均计入IT部门。当经济不景气时,不但不增加IT运维成本,反而还希望压缩IT编制和预算,就加剧了IT需求和IT运维成本之间的矛盾,乱占乱用现象就更严重了。
(4)IT系统的分散化,加大对IT运维成本的负担。早期IT系统的建立完全是根据企业需求应急建立,随着企业不断进步,这导致每套系统只为一个目标服务,有可能出现某些服务器性能、容量过剩,某些服务器又出现紧缺现象而不得不进行硬件扩容。过于分散的IT系统不仅加大固定资产的严重浪费,也加大了人力维护难度和成本。
(5)对运维技术人员的依赖过大,导致运维质量风险控制不力。在IT运维中,对于运维变更没有S.O.P标准流程,变更质量完全依靠单独技术人员的技术能力。对于出现的问题也需仰仗技术人员的应变能力。技术人员不得不频繁面对同样的变更和问题,而无心力进行进一步的能力挖掘。
如果一个熟练运维人员的岗位发生变更,当问题再出现时,就很难得到迅速处理。即使会有新人继续前人的工作,但他却无法继承前人的运维经验,这成为企业运维成本增加、重复投资的重要原因。
以上5点都是导致IT运维成本无法下降的因素,接下来我们就要讨论该如何降低IT运维成本。
4 如何保障高可用性和降低IT运维成本
 (1)根据企业发展战略,定制合理的运维目标和SLA。传统IT运维管理方式往往更注重IT技术指标,而这些指标的提升是否对企业发展有利,却无人问津。不同的运维模式对成本的要求也不同,对能满足的SLA也不尽相同。
所以,IT运维必须从后台走向前台,根据业务需求定制更明确的IT运维目标和技术指标,并以此来选择更适合企业当前阶段的运维模式,使运维成本最大可能发挥作用。
(2)引入戴明质量环质量控制模型,推行流程标准化控制。人员操作失误导致IT运维故障的比例远远高于硬件故障造成的事故,约占全部事故的80%。推行操作流程标准化,引入戴明质量环,每个变更操作依照计划—实施—检查—改进的步骤进行。计划阶段则对变更操作每个步骤制定明确、详细的执行操作手册;
实施阶段则严格依照执行操作手册进行变更;检查阶段则由非实施者对实施者的步骤进行复核;改进阶段则是根据实施实际情况对计划中制定的操作手册进行优化、改进。由这种方式来进行变更操作控制,将由于人为操作失误导致的隐形IT运维成本降到最低。
(3)IT运维规范化,减少运维随意性的浪费。运维管理包含人员、岗位、角色等信息,但如果这些信息没有统一规划,就无法进行统一管理。标准化运维流程是把运维各种事情(包括人员,资源,突发事故)分成不同级别,规范运维操作,以便有效的控制运维成本。因此,对于企业而言,IT系统的规范化运维是降低IT运维成本支出的重要因素。
(4)建立知识库平台,最大程度节省人力成本。知识库平台是指对IT运维中的出现的故障事件和问题解答统一存放并建立对外问题查询系统的平台。用先通过该平台寻找解决方法。如果问题没有得到解决,则用户在该平台进行问题申请维护,运维中心为用户每次维护申请都将在该平台中建立服务档案,并一直实时监控,直到问题得到圆满的解决,成功解决的问
题自动归档入知识库,为之后的用户提供自助服务。因此,知识库平台能帮助运维人员节省大量的时间,从而节省人力成本支出。
(5)加大监控力度,提高运维反应速度。之前阐述了来电响应式运维的不足之处,要化被动为主动,首先要做的就是加大监控力度。这里所说的监控包括两方面:一方面,对问题进度跟踪和监控。需对问题处理状态和时间进行实时监控,若发现无法及时解决该问题,应立即升级或转交问题至其他部门或二线,以防止问题恶化;
另一方面是对IT系统的监控,采用预警机制,在问题未发生前向相关运维人员报警。同时,要对监控数据进行定期分析,找到问题的根源和影响运维速度的因素,针对性地进行改进,将救火式的被动运维改变成可控式的主动运维。
(6)IT运维半自动化,提高人力成本使用效率。IT运维中有很多时间和精力要花费在重复的事情上,若采用纯人工方式的话,需要大量IT运维人员和时间来完成这些工作。但是,随着IT技术的发展,已经有很多自动化工具诞生,可以帮助IT运维将重复又简单的工作化繁为简,将运维人员从中解脱出来,从事更专业的运维研究,形成良性循环。
(7)采用IT资源动态共享化,降低固定资产成本。可以采用IT资源动态共享化,通过虚拟系统、共享存储等方法来提高资源利用率,规避IT资源出现东边不足,西边过剩的情况。

扫码关注公众号

温馨提示:因考试政策、内容不断变化与调整,信管网网站提供的以上信息仅供参考,如有异议,请以权威部门公布的内容为准!

信管网致力于为广大信管从业人员、爱好者、大学生提供专业、高质量的课程和服务,解决其考试证书、技能提升和就业的需求。

信管网软考课程由信管网依托10年专业软考教研倾力打造,官方教材参编作者和资深讲师坐镇,通过深研历年考试出题规律与考试大纲,深挖核心知识与高频考点,为学员考试保驾护航。面授、直播&录播,多种班型灵活学习,满足不同学员考证需求,降低课程学习难度,使学习效果事半功倍。

相关内容

发表评论  查看完整评论  

推荐文章