提起电信运营商,人们会很自然地想到这样的一些企业:它们制定电信发展规划,采购网络和电信设备,铺设通信管线,调试开通网络,为企业或者个人用户提供通信服务。传统意义上,建什么样的网络很明显是和提供什么样的业务紧密相关的,比如固网运营商主要提供PSTN、固定宽带接入以及企业级的VPN或者专线租用等服务,移动运营商主要提供2G或者3G的移动接入服务。总的来说这些业务是和特定的网络相绑定的,而网络更多的只是一个可靠的管道,它可以用来提供基本的通信服务,并不能灵活地提供增值服务(即业务)以及相应的加速能力。
在智能终端大行其道的今天,业务和应用日益复杂繁多,基于网络提供的连接和通信能力,各种增值服务不断出现。运营商也只有致力于全业务的管理和运营,才能满足未来用户的直接需求从而获得商业上的成功。
观念的转变
业务管理的首要环节是业务定制和开通。传统的业务支撑系统(BSS)和运维支撑系统(OSS)具备分散的、相对固定的业务定制和开通能力,由于缺乏体系化的开通支撑,传统系统的资源管理能力较弱,缺乏客户/业务/资源关联信息,还不具备全业务、长流程的自动开通能力。
对于已经开通的业务,传统OSS的管控以保障网络资产的稳定运行为出发点。比如,设备和管线能不能工作、有没有退服或者明显的性能指标下降是主要关注的方面,但对于网络上面承载的不同业务表现的好坏,以及最终使用者的感受和体验,则没有精细化和定量的监控及保障。此外,传统OSS侧重事后管理,不支持业务的全生命周期管理。
爱立信参与了全球140多个国家和地区运营商的电信运营系统的规划和改造,认为从网络管理到业务管理转变的关键在于运维信息化能力的提升,而BSS/OSS必须同步改造,才能实现从业务定制、开通到客户业务保障和投诉处理的全方位业务管理的协调统一。具体来说,下一代OSS(NGOSS)需要达到以下改造目标:第一,支持融合网络,支撑全业务开通和变更;第二,支持对业务的端到端实时综合监控,保障客户体验;第三,支持事前维护和端到端分析,主动优化业务质量。
支撑全业务开通和变更
全业务开通要求OSS具有全面准确的综合资源管理能力,提供客户/业务/资源关联信息,支持业务准确、快速开通,实现网络资源高效调度以及网络数据最优配置。
传统的烟囱式OSS服务于专业网络,比如无线网、传输网、数据网等,网络资源独立管理。全业务开通则要求所有与业务相关的网络资源能够统一管理,建立跨专业资源关联关系,实现资源变更的统一管理,支持网络资源的快速调度和调整。这其实也是融合网络管理的目标之一。有两种实现资源统一管理的手段:一种是将专业网络的资源模型适配到公共模型上,比如采用TMF的共享信息模型(SID),另一种是保留目前的资源模型,同时建立跨专业关联关系,具体实施需要考虑已有设施的类型及厂商的状况。

全业务开通还要求实现集团客户业务、家庭客户业务开通的长流程支撑,实现业务开通从接收到报竣的全程管理。业务开通系统在收到客户的业务定制请求后,首先会向综合资源管理系统进行资源申请和查询,如果网络资源符合业务开通要求,业务开通系统就会生成业务定制数据,并下发到用户数据中心(UDC)或者HSS等。对于需要配置网络的业务,业务开通系统会生成资源调度单和激活配置单等,OSS会通过设备商的OMC配置网络资源。业务和网络需要具备自动激活能力,实现自动化、批处理的网络数据自动制作和核查,提高业务实现的时效性。
此外,体系化的业务开通支撑也是未来OSS发展的重点。采用统一的开放业务平台来提供的业务可以根据网络特点开通在无线或有线甚至多媒体网络之上,用户可通过多种接入方式来获得所需业务。
业务定制和部署完成后,在业务使用过程中,业务端到端的质量保障成为重中之重。这是因为现有的OSS在管理能力上缺少从客户和业务视角的自上而下的监控和分析,缺少客户业务SLA质量保障支撑体系,端到端的业务质量管理能力不足。
对业务的端到端实时监控
从业务和客户的视角需要监控什么信息以及如何监控呢?由于这里强调的是实时业务质量和客户体验保障,而不是统计意义上的业务质量水平,因此除了普通的大粒度网络性能指标监控外,特别需要的是实时高效的网络事件监控,比如细粒度(5分钟以内)的业务质量和关键性能指标监控,以及重要客户、重要业务的重点跟踪。这些数据可以采自终端、网络甚至应用服务器,全面深入反映了业务相关的各部分设施的状态和行为。
不过这样还不能做到端到端的监控。比如移动视频业务涉及终端、无线接入网、核心网、IP网、传输网、数据网和ISP,目前各个网络由专业OSS管理,多源数据难以共享,跨专业业务流程难以关联,一个部分出问题,其他部分并不了解,很难准确找到故障关系并定位根原因发生点,并采取手段加以解决或优化。因此,未来OSS需要集中数据管理,以统一、标准的方式实现全专业、全信息监控以及关联。
在未来的运维过程中,一旦发生客户投诉,那么客服打开客户终端监控系统,该系统可以显示某个客户已开通的业务和使用情况,包括使用中涉及的信令触发事件和告警信息、细粒度准实时的业务质量和关键性能指标信息,以及其他参考信息(比如用户的终端类型、活动区域和业务使用历史等)。同时,与该用户业务使用相关的各部分网络的运行状况指标及控制面信息也一并显示。对于比较严重的问题,一般有告警或故障事件产生;如果没有告警产生,但出现实时性能下降的情况,OSS可根据准实时性能指标推算哪部分网络资源运行不正常,从而改变该用户设置来避免业务受到影响。图1是GPRS网络的客户投诉和监控系统的示意。
现在的客户投诉只能得到事后补救措施,那么我们可否在客户进行投诉之前预判潜在业务风险,尽早调整用户业务使用的策略或方式,以减少投诉的发生?答案是肯定的,我们可以看下面关于在高负荷网络状态下进行智能业务推送的案例分析。
在美国,Verizon和at&t这两年先后开始大规模部署和商用LTE,但都在iPhone、Blackberry等智能终端大量使用后遇到了带宽瓶颈(at&t最近两年连接数的增长如图2所示)。很多用户同时在一个无线小区内使用业务造成小区过于拥塞,但仍有新的用户试图接入该小区。如果OSS具备实时性能监控能力和跨专业关联能力,就可以从接入网中获得某小区业务接入成功率、掉线率、活跃用户数和流量使用等监控数据,进行分析后,核心网的PCC可以结合此信息以及客户订购的业务等级来调整用户业务推送策略等,避免在热点地区高峰时段盲目推送造成无谓的资源占用和服务质量下降。此外,还可帮助运营商确定哪些是热点小区、哪里需要扩容,对运营商未来的宏观决策提供参考。这对于中国的运营商同样具有参考价值,尽管目前中国在网的智能终端比例还不大,高流量数据业务使用还不算广泛,但这种压力很快就会到来,并有可能成为客户投诉的重点,提前做好技术上的准备无疑是明智的。

图2 at&t遭遇带宽瓶颈
爱立信OSS产品线中的ENIQ就是一个实时的业务、网络、终端监控系统,并且支持跨专业监控。该系统可以根据运营需求定制智能化的业务管控功能,满足不同类型用户的业务跟踪和保障需求。图3是目前ENIQ实时监控3G网络的示意。
业务质量保障
实时业务监控可以及时发现客户业务使用问题,追溯问题根源。对于严重故障立即采取补救措施以恢复业务正常,对于因性能、容量等瓶颈造成的业务质量下降,则应调整用户的使用策略或设置来规避不佳的服务状态。但实时监控获得的用户行为或者网络状态不具有持续性,在一个时段具有的异常状态,另一时段可能就消失了,如果根据某个时段的监控结果贸然判断网络欠佳而采取调整措施,可能会破坏网络的稳定性,虽然解决了眼前的问题,但新的问题会马上出现。因此,需要综合分析实时的监控数据、拨测数据和统计监控数据等,来发现因网络可能存在的固定缺陷所导致的业务质量问题。这里涉及的数据来源如下:
1.实时监控数据:来自于网络、终端实时信令、事件监控和细密度性能指标上报;
2.拨测数据:来自于主动定向的拨测行为;
3.计监控数据:来自于常规的性能指标KPI报告。

图4为WAP业务对应的综合监控示意。
对以上数据分析处理的目的是要对网络质量和工作效率做全面分析,涉及到网络容量、网络质量、业务量、运维效率等。此外,以上分析也可同时支持历史数据分析、应急保障分析、网络规划扩容预测分析和网络优化分析。
对于某个业务的质量评估,则需要建立业务到上述监控数据的映射关系,也就是KQI-KPI的映射,根据各项网络指标加权结果的高低来判断业务运行的好坏,当把实时、拨测、性能报告三种测量都考虑进来,就可以得到一个全面、客观的评价结果。
具备了强大的分析能力后,系统就可以采取事前的网络优化手段以规避可能发生问题的风险。爱立信认为,不管运营商是否部署自组网(SON)系统,网络自主优化都是未来运维必须具备的能力。当然,自动化程度高低、优化的重点、优化的流程和评估方法,则需要根据运营网络的阶段和需求来周密规划和考虑。这里可以提出的OSS建设目标包括以下内容:
1.支撑无线网络自主优化;
2.实现参数自动配置、场景自动核查与生成、频率自动优化、网优向导、黑点管理、问题小区识别和恢复;
3.为无线网络分析、优化方案制定、优化方案实施及优化效果综合评估提供支持。
从实际网络部署经验来看,有些运营商由于刚刚赢得某个客户或者在客户挽留中胜出,就急于向这些大量新进或升级的客户开通高流量业务,业务质量往往会随着客户的迅速增加而急剧下降。因此,提前做好商业模型的分析,对网络能力和容量做出合理的优化甚至扩容是十分必要的。美国一些运营商由于没有做到事前评估和优化,在LTE部署初期遭到了服务瓶颈而被迫强行限流,对中国运营商不能不说是一个警示。
全面改造OSS
全业务、长流程、端到端、注重客户体验,这些管理要求都在强调一点,就是高度的运维信息化。任何出现的异常情况或者特定状态,都可以在深度上进行挖掘,在广度上进行关联和追溯。这些要求OSS的架构向着更加融合与集中的方向发展。资源管理、网络监控、数据收集、信息分析、自动优化,这些部分组成了完整的OSS体系,将是运营商进行下一代OSS改造的主要领域。一旦改造成功,运营商就真正具有了业务运营的实力,可以彻底摆脱管道和基本业务提供者的不利处境。