【编者按】电信重组和全业务运营,随之而来的将是轰轰烈烈的新一轮IT 支撑系统扩容和演进。中国电信上海研究院的专家认为,运营商在重组后的IT 建设中,应当更注重业务服务管理方法论和IT 内控方法论的实施,并进一步完善商业智能的应用系统———企业数据应用门户。
业务服务管理倡导主动服务
■中国电信股份有限公司上海研究院 段勇 石屹嵘
IT运营面临的新挑战
作为业务运营的支撑部门,IT部门的首要任务就是“一切向业务看齐”,业务部门怎么说,他们就怎么做。这说起来很容易,操作起来却很难。因为负责运营支撑系统运维的人员,他们整天都疲于应付业务部门报上来的故障和提出的各种琐碎的需求,压力实在太大了。
另一方面,如果IT部门人员对业务部门使用系统时的体验缺乏了解,在过去这可能无关紧要,但现在问题就大了,因为现在业务部门的要求都很高,由于激烈的市场竞争压力,它们对业务中断、性能下降之类的IT问题毫无忍耐性。当业务部门要服务水平报表时,他们期望这些报表是基于业务流程产生的,而不是充满了像服务器正常运行时间、CPU和内存使用率之类的IT词汇,这对他们来说一点意义也没有。
业务服务管理
近年来,业务服务管理逐渐成为了IT运行维护领域的热门话题,主要实现了如下一些目标:
(1)能够为业务人员、管理人员和IT运维人员提供一致的可视化监控管理视图;
(2)能够从业务的角度,主动管理整个企业的业务流程和应用;
(3)为业务人员、运维人员提供一种通用的语言,以便对需求、问题和重要性/优先级进行交流;
(4)主动解决应用中存在的问题;
(5)管理企业IT系统的基础构架。
业务服务管理是指把业务服务的可用性和性能状态,与底层IT系统构架和应用部件关联起来,提供一个以业务为中心的IT服务平台,支撑业务的运营;同时可以提供基于用户体验的业务监控。
业务服务管理的主要功能
(1)业务模型建立和管理
一个业务会涉及多个系统多种应用,相互之间紧密关联,互相合作。建立业务与IT基础资源的业务模型和视图,首先需要了解业务和应用之间,应用和系统之间,以及应用之间的关系,管理人员可以手工创建服务模型,也可以通过自动发现工具或者CMDB自动导入,形成服务模型,并在发生事件时,准确定位和判断故障点。
同时,在构建业务服务模型时,能够灵活地设置各个业务服务元素的SLA,指标包括一次严重告警事件持续时间、单位时间内发生影响业务的严重告警事件数量、单位时间(如1小时、1天、1个月等)内发生影响业务的严重告警事件累计时间等。
业务模型管理能够提供灵活的图形界面方便的管理业务模型,动态映射业务至底层系统构架,灵活的设置不同层次业务元素的依赖关系,从业务的角度主动进行管理。
在完成业务模型构造后,IT基础架构中各类告警事件能够和业务模型中的各类实体状态联动呈现,如当出现影响业务的告警事件时,相关的实体可以根据其受影响的程度呈现不同的状态颜色(如黄色、红色等),当该告警事件清除后,可以自动恢复其受影响的服务实体的颜色(如变为绿色等)。
(2)业务影响分析
业务影响分析可使运维管理人员对IT基础架构中部件故障所造成的影响迅速做出评估,这一重要信息可使他们就解决问题的轻重缓急进行正确抉择。例如,计费系统的备用主机故障时,由于有备用主机,只会将依赖该系统的计费相关业务设置成告警状态。而当计费系统应用出现故障时,该状态即会从告警转变成危急。
通过业务影响分析,能够在业务服务模型上呈现SLA指标情况,当达到或超出SLA指标时,状态条能够根据具体情况呈现不同的颜色或状态。当出现超出SLA规定指标的情况发生时,能够产生业务服务的SLA告警事件。
可以将不同的用户角色和业务视图进行关联,使得特定的用户只关注特定的或与之相关的业务。这种角色可以根据组织、地域、应用逻辑、个人专长或运维组织的岗位来进行划分。不同的角色对业务视图具有不同的权限和处理能力。这保证了每个维护人员将专注于自己擅长的或职责相关的领域,从而提高了问题解决的效率。







































