1 BOSS系统架构概述
业务支撑系统(以下简称为“BOSS系统”)是基于计算机技术,融合了计算机软硬件以及移动通信的部分特点于一体,用于支撑移动通信业务运营和管理的IT系统。随着移动通信业务运营内涵的极大丰富和服务对象群体外延的不断扩大,BOSS系统无论是业务种类、业务规模还是业务流程,都变得非常庞大和复杂。要研究BOSS系统的应用业务和网络流量相关性,必须首先对BOSS系统进行分类,然后比照网络拓扑图,按照业务逻辑分别对收敛的采样点进行数据流的采集和分析,建立相关业务的数据模型,定量及定性分析业务逻辑流量和网络流量的关联关系,进而推理出相关业务逻辑数据流随着业务量的变化对网络资源开销的影响程度。
BOSS系统分类方法很多,有按功能域分、按服务需求分、按安全域分等。BOSS系统的业务种类繁多,因而各业务系统网络及性能管理是一项复杂而富挑战性的工作,这当中包含了多项因素。本文选取一个典型的业务平台——10086短信业务平台,对短信业务的业务数据流和网络流量做抽样性分析,以此作为对BOSS应用系统研究和维护管理的方法论,进而推广到整个BOSS系统业务维护和管理系统中。
210086短信业务平台架构概述
2.1 BOSS短信业务平台业务概况
上海移动10086短信业务平台是BOSS系统向移动客户提供基于短信交互方式的资费和业务查询、业务定制和退定、手机功能开通和取消、套餐申请和转换、积分兑换和促销活动等个性化服务的E渠道之一。
上海移动10086短信业务系统是以计费信息中心BOSS系统为核心,利用运行维护中心的行业网关平台,向移动客户提供便捷的端到端服务的跨平台、跨部门的业务系统。
2.2 BOSS短信业务平台系统概况
BOSS短信业务平台计费信息中心侧由两台DELL2650 PC服务器做短信接口服务器,一台IBM P650_1做短信中间件服务器,一台IBM P650_2做短信数据库服务器,此外还有两台BOSS营帐数据库服务器。
BOSS短信业务平台运行维护中心侧由两台HP行业网关服务器做对应。
计费信息中心侧与运行维护中心侧通过10M城域网经由一台CISCO3725路由器互连,2M数据链路做备用。
3 BOSS系统短信业务网络和服务器流量捕获研究
3.1 业务流量和网络流量的对应关系
为了有效捕获网络流量,研究业务流量和网络流量的对应关系,需要采用特定的流量分析设备,具体包括一台NetScout 4端口百兆探针NGenius 9241硬件设备一台,和NetScout nGenius Performance Manager软件一套。
为收集网络流量,在网络中放置探针,通过交换机上的端口镜像将业务流量端口镜像到探针连接端口,流量经过探针处理后再传送到集中的性能管理服务器(nGenius Performance Manager,简称PM),用于全局的网络分析。
NetScout设备能够自动识别常见网络协议以及应用端口,如HTPP、FTP、Telnet等。为有效标明短信数据流,在详细分析数据流的基础上,根据IP地址以及应用端口定义了如下应用:
◆ 短信接口到短信中间件Upstream:10.10.169.30 <—>10.10.167.13,TCP port:28500;
◆短信中间件到短信接口Downstream:10.10.169.13<—>10.10.167.30,TCP port:28540,28518;
◆短信中间件到营帐数据库YZ_DB:10.10.167.13<—>10.9.215.24。
3.2 小结
(1)经过大量统计和运算,获得流量特征值T的对应表和K值,以及流量推算公式:
F’XX=短信业务量*K*T
其中,XX是任意段的流量预估。
如行业网关到短信接口的流量=200,000*1754*3.78/小时=1326M/小时。
(2)短信业务量每小时峰值40万是中间件环节处理和吞吐能力的预警线,因为此时短信中间件服务连接端口流量=短信中间件服务到短信数据库的流量短信中间件服务到营帐数据库的流量短信中间件服务到短信接口机的流量=47.6Mbps,达到网络连接100M的近50%。对于网络来讲,50%的利用率是一个预警的尺度,需要考虑采取措施如升级处理性能和带宽等。
4 应用拓展
 [FS:Page]; 4.1 网络系统维护
流量和业务量分析模型,可以很好地运用到网络和主机系统的日常运维中,包括日常系统及业务流量监控、故障诊断,还可以用于网络规划的辅助工具。如:
◆建立正常工作情况下的流量基线;
◆实时分析网络流量,掌握流量的动态变化;
◆监控应用的响应时间,逐段分析系统延迟的组成;
◆确定时延导致根源,分析究竟是服务器、应用还是网络造成的;
◆一旦发觉服务性能很差(响应时间太长),可以分析和比较Application Response Time 与Network Response Time,知道响应时间长是网络造成还是Application Server本身造成的;
◆掌握网络流量与业务量的对应关系,分析业务量的增长趋势;
◆ 区分网络传输时间与服务器响应时间等。
4.2 故障诊断及流量预测
流量和业务量分析模型,可以很好地运用到日常系统及业务流量预测、故障诊断,为更好的系统维护作业计划打好基础。如:
◆对网络误用、黑客入侵“错误!未找到引用源”、服务暂停、超时响应等做出实时告警;
◆ 提早获得流量异常“错误!未找到引用源”(如病毒爆发)的提示,预防问题的发生,并得到导致告警的应用、主机和通信对,了解流量异常的根源;
◆根据总流量、广播包占用量、包CRC Errors、Multicast包占用量、不同应用的时延设置门限告警;
◆24小时不停监视网络异常,并发出告警,数据包捕获,协议解码分析;
◆实时了解网络流量情况,及时获得导致告警的根源;
◆得到异常占用网络的用户的行为、特征,如黑客入侵;
◆基于前期流量,分析未来走势,对于可能产生的系统、网络瓶颈,提前采取措施,满足业务增长的需要;
◆通过趋势分析预测过载发生时间,有助于规划容量以应付未来需求。
5 结束语
本文通过抽样选取10086短信业务作为研究的对象,比照10086短信业务的业务逻辑和受理流程,采用特定的流量分析设备,得出业务流量同网络流量之间存在的对应关系,进而推理出短信业务逻辑数据流随着短信业务量的变化对网络资源开销的影响度。流量和业务量分析模型可以很好地运用到网络系统维护、故障诊断及流量预测等方面,并可作为网络规划的辅助工具,对3G时代的到来所带来的网络与业务架构变化有很好的借鉴意义。