更全的杂志信息网

基于海量数据的VoLTE用户语音感知系统研究

更新时间:2009-03-28

1 引言

随着移动推行“四轮驱动”融合发展战略,4G发展一直保持行业领先,2016年4G用户数和4G渗透率达到新高,2017年的目标是4G用户突破6.3亿,VoLTE用户突破1.5亿。VoLTE语音逐步成为用户通话的最基本选择。高质量的语音、更快速的接通给用户带来更好的体验的同时,对网络质量的要求也越来越高。差的VoLTE语音感知往往会引起用户投诉,一线的优化压力日趋增长。

  

图1 移动用户数及4G用户占比图

针对江苏多个重点城市VIP投诉详单抽样分析,语音质量类问题是影响用户感知的主要问题,占VoLTE投诉的70%+;其中4G弱覆盖、干扰等仍是影响用户感知的主要因素。

目前每天南京的VoLTE高清语音质量通话次数大约35万,未来五年随着VoLTE业务的建设和深入发展,VoLTE高清语音将成为主流,预计增长20倍到700+万通话/天,若VoLTE语音质量问题占投诉的70%,一旦等用户规模成倍增长,而VoLTE语音质量问题无法得到有效解决和闭环,等比20倍的投诉量增加将是灾难性的。

  

图2 VoLTE问题占比图

而目前结合现网优化经验,传统的KPI指标在网络性能较差的情况下能够反映网络问题,但是在网络质量提升到一定水平后根据KPI指标就很难真实的反映用户体验好坏,往往会出现传统KPI指标非常好的情况下用户体验并不好;更进一步的KQI指标有一定改善,但是从VIP投诉分析来看,还是存在MOS值满足要求,用户体验不好的情况。因此,针对传统KPI指标无法及时发现VoLTE语音质差并及时解决和闭环这个难题,需要一种新的方式能够识别VoLTE语音质量导致的客户感知差的问题,并能够推动促进问题高效解决。

2 基于海量数据的VoLTE语音感知系统实现原理

传统的网管指标最小粒度是5min粒度,没有反映用户听不清的指标,且无法表征真实的用户感知,本课题提出的VoLTE语音感知研究,基于反映用户听不清的吞字指标,对话音流进行切片,以5s为粒度进行分析,对比传统网管的5min粒度指标,解决了问题点因过粗的统计而湮没在样本中的问题。

其中断续、单通是比吞字更加严重的情况,吞字是否发生能够在一定程度上表征用户语音质量体验。下图是吞字发生在语音频谱上的典型体现:

2.1 关联原理

吞字表征语音质差相比IPMOS的优势:

  

图3 VoLTE语音质差小区原理图

2.2 第一步:质差用户如何表征

在3GPP LTE中,VoLTE业务编码有AMR-NB窄带和AMR-WB宽带两种编码,两种编码速率具有不同的话音质量,所以又分别称为VoLTE标清语音(或VoLTE 12.2kbps)和VoLTE高清语音(或VoLTE 23.85kbps)。

AMR-NB和AMR-WB这2种编码具有如下特点:

(3)切换因素识别

每20ms产生一个语音包,包括了RTP/UDP/RLC-Security压缩头;每160ms生成一个SID语音静默包。帧长20ms;普通人讲话的语速为每分钟120至180个汉字左右(新闻联播播音员的语速280到300字)。因此,普通人大概1个字占16~25个语音包。

重组改构人肿瘤坏死因子对比顺铂胸腔灌注治疗恶性胸腔积液疗效与安全性的系统评价 ……………… 郭奇遇等(6):839

用户语音质量体验差总结起来有三种感受:

吞字:感觉对方说话吐字不清,或者漏字。

断续:感觉对方说话时断时续,有明显停顿感。

单通:完全无法听到对方说话。

美股近日表现反复,道指周三单日急升过千点,创9年半最大单日升幅,但若论12月以来形势,三大指数累积跌幅仍有大约10%,很大机会创下自1931年经济大萧条以来表现最差的12月份。中港股市亦持续于低位浮沉,内地最新公布11月工业利润按年倒退1.8%,至5950亿元人民币,为2015年以来首次下跌,加深市场对经济增长放慢的忧虑,恒指再度失守25500点,为11月初以来首次收市跌穿此水平。轮证资金流向方面,投资者倾向部署好仓博反弹,截至本周四的过去5个交易日,恒指好仓(认购证及牛证)共录得1.5亿港元净流入,同期恒指淡仓(认沽证及熊证)净流出9千万港元。

通过海量数据的分析,发现丢包是影响语音质差的关键因素。但是,是否语音质差,不完全取决于整体的丢包数量和丢包率,而取决于在具体时段的丢包数量。

店子几天没开门,老巴立即忙着清理货物。阿东上前帮忙说:“爸爸你要不要歇几天。你的腿磨成那样了,最好去医院上点药。”

经过对海量样本以机器学习算法研究,一般情况下的表现如下:

吞字:连续20个包,丢12个包。

断续:连续50个包,丢30个包

为了避免在异常情况下由于某些特定用户导致的问题出现,质差小区信息中关联该小区下的故障通话次数、故障通话用户数,一旦出现故障通话用户数远小于故障通话次数,则判断为用户因素,因某些异常用户导致了大量的故障通话。

单通:丢包率大于80%。

如图5所示,光镜下观察小鼠肾上腺结构,肾上腺皮质由外向内依次为:球状带、束状带、网状带,对照组球状带排列成襻状、圈状或者篮状;束状带向心性排列成束状;网状带细胞排列成网状。与对照组比较,抑郁症组和BCRD模型组出现不同程度的束状带变宽,细胞增大,网状带的细胞相互吻合成更密集的网状结构,并且出现了细胞排列疏松且散乱,细胞间隙变宽,细胞核固缩和深染,胞浆空泡增多等现象,提示皮质功能处于亢进状态。

  

图4 吞字语音频谱图

从用户体验入手,将VoLTE语音质差小区识别出来,排除终端、用户故障的干扰,并关联已有的无线侧其他系统定位的问题,实现自动派单,提供给网优部门处理。本研究课题通过三大步实现精准的质差小区定位。

认真做好形势任务教育,通过打造“高度负责任,高度受尊敬企业”大讨论及形势报告会、职代会等,让每位员工认清当前面临的形势和任务,把发展的目标、方向讲清,把政策讲透,把关系员工切身利益的问题讲明,让员工明白自己是单位的一分子,只有单位好才有个人好这个道理,统一思想,凝聚力量,增强信心,提高员工的主人翁意识,将为企业的发展出力变为员工的立足岗位做贡献的自觉行动。

  

图5 产生吞字的IPMOS值分布图

2.3 第二步:问题快速定界

基于用户、终端、小区等因素排查

(1)终端因素排查

前期我们用IPMOS来评估语音质量,但是其实通过统计指标加权综合评分,并不能够完全表征用户语音质量感受,通过对从南京市抽取的2348份通话记录进行对比如下所示,并不是所有IPMOS好的场景都不发生吞字。

故障终端按照小区维度动态监控,通过语音质差小区信息关联其小时维度ToP质差用户终端型号,一旦出现终端型号集中,应判断为终端问题。

经过大数据样本统计分析,正常情况下终端故障不会大面积集中出现。如下图7所示,取南京全网1天数据,最差的终端故障率仅为2.9%,日常VoLTE语言质差并没有因终端原因引起的。

  

图6 快速定界手段图

  

图7 TOP终端故障率图

(2)用户因素排查

伊犁河谷向来有塞外江南的美誉,“察布查尔”在锡伯语里译为粮仓,当地出产的有机大米在全国享誉美名,农业发展在这个地区经济发展中占据着十分重要的地位。伊犁河南岸的孙扎齐乡也不例外。

经过大数据样本统计分析,正常情况下Top质差用户不足以影响Top质差小区的识别。

综上所述,对神经外科疾病合并糖尿病患者实施围手术期针对性护理,可以显著降低并发症发生率,缩短住院时间,提高患者的舒适度,具有重要的临床应用价值,值得在临床上推广和应用。

  

图8 TOP质差用户排除图

基础层和传输层信息经济发展薄弱的省份应大力夯实信息经济发展基础,从而推动其他层信息经济的发展。通过落实招商引资政策,大力发展电子信息制造业和软件技术服务业,为公众使用互联网提供可得性和便利性。推进地方性项目工程发展,如企业信息化服务平台、制造业信息技术集成应用、先进工艺流程信息化等建设内容,实现“两化” 深度融合的快速发展,并推动电子商务基础设施改造升级,积极推动省级电子商务示范城市建设,探索农村电子商务试点工作,为信息经济新兴业态的孕育与发展奠定良好基础。

通过大数据识别,将一天内数以千万计的通话情况、语音质量、切换情况关联。

  

图9 切换关联原理图

如下所示,识别出在切换情况中出现的语音异常的场景,识别出切换导致的语音质差问题。

  

图10 切换中识别出的语音异常的场景图

2.4 第三步:质差用户Top小区识别

基于大数据的Kmeans聚类算法将质差用户按照小区位置进行聚类,识别出Top质差小区。

马克思在《手稿》提出了三大社会形态理论,突出以人的社会交往状况、人的发展状况为基础来阐述人类历史的发展阶段[8],尤其是明确强调“第二阶段为第三阶段创造条件”,而这也就是马克思所说的资本的历史文明作用。实践表明,资本首要的历史使命是为了更好地发展社会生产力,随着生产力的不断发展,资本不仅为新的更高的社会形态创造出了强大的物质基础,同时也为人的自由全面发展提供了必要的物质基础。

  

图11 质差用户Top小区图

3 依托大数据手段对语音质差小区的精准定位和处理

3.1 关联无线传统派单,多维度反映5s质差Top小区原因

通过统计分析,大概30%的小区在业务体验差的情况下,会在传统的无线监控指标上有体现。因此,通过关联传统的容量不足、覆盖、干扰等无线指标,从多个维度反映该5s质差Top小区的原因,避免了传统派单中仅针对单一指标进行优化而导致的资源浪费问题,并能大大提升一线优化问题的处理效率。

3.2 根据大数据OTT定位信息,栅格化呈现质差具体位置

由于传统网优手段的限制,若无法用传统的网络监控KPI指标识别的问题,处理难度大。通过人工拉网排查成本高效率低。

机组电源理论上可以直接使用机组串联法叠加,即使需要使用叠频变压器,也可以让副频经叠频变压器叠加到主频机组,不会导致叠频波形变形,更符合GB/T 21211—2007 《等效负载和叠加试验技术》第10.4条的规定以及相关计算公式的应用。变频机组的电机飞轮转矩本身就是一个很大的储能元件,不需添加其余设备就可以很好的平滑叠频进行中的拍频能量波动。

因此,针对70%语音质差识别的无法用传统保障措施发现的故障小区,需要采用新的方法来解决——这就是基于软采数据的大数据OTT定位信息,如下图所示,基于高铁小区进行专项试点显示,通过这个方法能够精准的识别出现语音质差的具体位置,以及无线相关的具体信息,能够有的放矢地指导网优人员做精准专项优化。

  

图12 基于大数据OTT定位信息的栅格化辅助定位图

实际数据显示,基于语音质差故障栅格化呈现的方式,精准地完成了语音质差小区的优化。

  

图13 质差用户Top小区处理效果图

4 结论

本文针对传统的无线网络质量保障无法提升用户体验的不足,提出了基于5s切片技术的基于大数据的VoLTE语音感知系统。从表征用户体验吞字入手,自动实现问题定界,依次分析终端、用户、切换因素,将VoLTE语音质差小区精准识别出来。并关联已有的无线侧其他系统定位的问题,依托OTT定位栅格化信息,实现自动派单,提供给一线现场网优处理。目前该系统已在南京上线,质差小区具有很高的准确性,能够较精准地完成语音质差小区的优化。该课题对于一线优化生产将带来很大帮助,具有全国推广的意义。

 
朱伟,艾怀丽,张桂荣,赵志扬,张晶,梅明涛
《江苏通信》 2018年第02期
《江苏通信》2018年第02期文献

服务严谨可靠 7×14小时在线支持 支持宝特邀商家 不满意退款

本站非杂志社官网,上千家国家级期刊、省级期刊、北大核心、南大核心、专业的职称论文发表网站。
职称论文发表、杂志论文发表、期刊征稿、期刊投稿,论文发表指导正规机构。是您首选最可靠,最快速的期刊论文发表网站。
免责声明:本网站部分资源、信息来源于网络,完全免费共享,仅供学习和研究使用,版权和著作权归原作者所有
如有不愿意被转载的情况,请通知我们删除已转载的信息 粤ICP备2023046998号