首页 > 技术 > 技术文摘 > 探针式BOSS业务监控系统实战分析

探针式BOSS业务监控系统实战分析

2010-03-03 00:00:00   作者:   来源:   评论:0 点击:



—.探针式BOSS业务监控系统实战分析
  运营商当前的业务运营支撑系统(BOSS)存在先天不足,既没有能力感知BOSS系统的运营状态,也没有能力预知故障的发生。3G时代,BOSS系统如何才能告别“无知”,先于用户发现问题,变被动为主动,提高运营商业务质量?
  3G的正式运营,带来了国内三大运营商(中国移动、中国联通、中国电信)之间白热化的竞争。用户的持有量是各运营商实力的一个重要衡量指标,而网络质量和业务能力则决定着运营商能否持有较多用户。对网络质量和业务能力的保障涉及到运营商内部多个部门以及工作环节,其中业务支撑是十分重要的一环:业务运营支撑系统(BOSS)故障会导致营业厅关门、客户投诉升级等重大问题的发生,严重影响公司业务的正常运营。BOSS系统如何实现对业务能力的保障?如何使运营商业务支撑运营工作全面提升?
  BOSS系统的先天不足
  当前运营商的BOSS系统普遍存在着先天不足:既没有能力感知BOSS系统的运营状态,也没有能力预知故障的发生。很多地方运营商的BOSS系统不同于传统的电信设备系统,并不具备电信级的能力标准,而是附加了很多具有中国特色、甚至各省特色的IT系统,在可靠性与可维护性上都与电信级产品相差甚远。这种先天不足主要体现在“可监控性差”上。各个运营商都经历过或正在经历着被动的BOSS维护模式三部曲:“客户投诉—发现故障—故障修复”。
  如何让BOSS运维人员能够快速发现、有效解决业务问题,全面了解业务运营系统的各种运营信息以及用户的感知呢?
  几大运营商都在千方百计寻求自身BOSS业务支撑运营能力的提升。以中国移动为例,中国移动集团公司曾经下发过相关业务技术规范,多家省移动公司都做过相关的尝试。其中,上海移动曾在BOSS系统改进和提升方面取得了一定的突破,其具体方式是:直接在BOSS系统中增加维护代码模式。这种做法的优点是时效性强,缺点是维护代码与BOSS系统捆绑过于密切,难以实现大范围普及。
  BOSS也能实现监控
  中国移动浙江公司在借鉴了上海移动BOSS改进模式的经验之后,经过为期二年的探索及验证,构建了探针式BOSS业务监控系统。探针式BOSS业务监控系统提出了“以BOSS业务监控为核心”的理念,采用“探针式提取、指标引导、建模驱动”的方式,打造一站式BOSS业务监控系统,既实现了对现有实际业务系统的有效监控,也满足了BOSS运营管理的需要。
  探针式BOSS业务监控系统由五层组成:数据采集层、业务建模层、数据聚集层、告警管控层、分析展示层。这五个不同的层次在运营商业务能力的提升和运营管理水平的提高上都起到了什么作用呢?
  数据采集层: 是整个监控系统的基础,用来提供核心的业务健康度建模和可用性建模所需要的平台、应用、业务等数据。
  系统数据采集共采用了三类探针:A式探针直接模拟BOSS前台业务操作,采集BOSS门户各种业务应用的可用状态; B式探针负责采集A式探针发起的前台业务所触发的BOSS后台数据操作日志统计值,以及BOSS后台系统运营状态,并将其发送业务监控系统; C式探针从BOSS接入交换机中全量采集BOSS交易记录,即第一时间采集到实际BOSS运营的状态。
  综上所述,这三类探针能够获取到从业务发起、业务处理、业务交易到业务完成全过程的用户能够感知到的所有业务数据,为从用户感知角度进行业务监控提供了坚实的基础。
  业务建模层: 是整个监控系统的核心,是将业务进行有形化管理、量化衡量的高效手段。该业务建模层中涵盖了几乎所有的BOSS管理资源要素,包括业务、应用、服务及其他平台类资源,这些信息都建立并实时更新于企业集中建设的符合ITIL标准的CMDB(配置资源数据库,其中每一子项便是一个CI配置资源项)中。基于CMDB中动态调整的实时CI项和相互关系,关联上能够反映业务当前状况的KPI指标,以结构化的模型框架为指导,建立完整的业务CI/KPI指标体系,绘制出以业务为中心的BOSS系统视图,全面展现其健康度和可用性。
  CI/KPI指标体系的建立是以业务为主线,按照“CI业务-应用-平台”的分层结构,针对每一层设定支撑域、运营域和服务域的指标分类标准,并在这些指标的基础上通过关系推导和加权计算创建业务健康度和可用性量化模型,将业务的层层嵌套、互相关联与后台软硬件平台之间的关系都量化出来,并综合为直观有效的业务运营状况指标; 作为监控系统的核心,业务建模层为告警管控层的预警和故障定位提供了衡量基础和分析逻辑,如果健康指标超出经验化阈值,业务预警可帮助维护人员将业务隐患消除于萌芽之中。
  CI/KPI模型的建立,成功地将传统监控系统的监控难点转变为亮点,通过对模型中父子业务间关系、业务与后台资源间关系的结构化梳理,多维度数据的采集计算,有效量化了业务健康度指标。同时,模型中所综合的业务可用性、业务办理量、后台资源使用情况等全方位信息,尤为适合公司管理人员了解业务通体运营情况。
  数据聚集层: 在这一层,系统将经过CI/KPI模型、按不同业务规则结构化之后的三类用户体验数据进行汇聚:业务监控数据(业务可用性、业务量、业务办理时长、业务的后台服务器负载情况等)、配置数据(从CMDB中定时同步配置项信息和配置关联信息),业务感性数据(业务量、积压量和投诉等信息),使得运维人员不仅能够从IT支撑视角掌握业务运行状况,还能直观了解到在当前业务运行情况之下客户层面的使用感知。

图:探针式BOSS业务监控系统架构图

图: 采集层探针

  告警管控层: 本层提供基于预警模型的预警管理和追根溯源的告警定位处理。

图:业务三维立体分析展示

共 2 页:1 2 

计算机世界报

相关阅读:

分享到: 收藏

专题