观测器

直播回顾5GC和电信云构建云网络可观

发布时间:2022/6/19 18:32:13   

“云原生可观测性分享会”第六期《5GC和电信云构建云网络可观测性的必要性》由云杉网络售前解决方案专家李飞演讲,针对5GC运维剖析为什么云网络可观测性是拉通5GC和网络云之间运维能力,讲解如何消除三层解耦的阻塞点,实现网络云和云上5GC业务高效、可靠的运行。

点击文章末尾的可前往直播回看地址。下文为直播实录,接下来请大家开启沉浸式阅读模式吧。

大家好,我是云杉网络李飞。今天由我为大家带来第六期云原生可观测性分享会直播。在本期直播中我将带领大家梳理电信运营商5G核心网和电信云在过去、现在和未来的运维中遇到的问题和困境,并用IT领域的可观测性理论为大家剖析这些问题的根源,以及如何通过云网络可观测性来解决5G核心网和电信云的运维困难、三层解耦的困难。

期待通过这次分享能为各位带来一些新的思考、新的理念、新的方法,为奋战在运营商核心网运维一线的工程师、运营商的技术研究人员、设备商的产品设计人员提供一些借鉴。

Why

5GC和电信云构建云网络可观测性的必要性

各位听众可能首先有一个疑惑,什么是云网络可观测性?为什么5G核心网和电信云需要云网络可观测性。在解答这个问题之前,需要先了解5G核心网和电信云的运维遇到了哪些问题。0过去:全球发生多次5GC故障

5G通信网的稳定运行是保障社会稳定运行的重要基础,而5G核心网则是5G通信网的枢纽和大脑,是整个通信网运行、维护、保障的重中之重。在过去的年,其实5G核心网在全球发生了多次影响范围大、持续时间长、社会影响广的故障。

在年的4月份加拿大Rogers发生了一次长达26个小时全国范围的移动通信网故障,经过事后分析,是由于某厂商的5GC软件升级触发了隐性的Bug,故障发生后缺乏快速定位手段,导致故障难以在短时间内定位、消除。

在年的年底,国内某省也发生了一次持续7个小时的大规模断网事件,影响了全省移动网用户的业务使用,据称在定位过程中一直难以锁定故障点,只能通过重新部署网元软件恢复故障。

在过去发生的这些影响范围大、持续时间长、业务恢复困难的5G核心网运行故障,一方面说明5G核心网的运行稳定性有待提升,另一方面说明现有的故障监测、快速定位、快速恢复能力存在短板。

02现在:5GC的运维困境

经过我们对很多运营商一线运维技术人员的调研和交流,现阶段5G核心网的运维总结下来就是:()云网络“黑盒化”:(2)运维技术难度高;(3)故障定责定界难;(4)云平台面向业务的保障难。

什么是云网络“黑盒化”?5G核心网自身运行的网络IP节点数量已经百倍以上规模的增长,容器化微服务POD形成一个Full-Mesh的网络,网络的虚拟化、弹性变化,使得整个5G核心网的内部网络“黑盒化”。

为什么说运维技术难度高?我们会发现5G核心网引入了云、容器技术所需的运维技术横跨数通、服务器、SDN、虚拟化、容器、5G等诸多技术专业,各技术专业领域跨度大、技术协同难度高。

由此导致在具体的运维排障过程中,故障的定责定界难,业务问题在网元层、云平台之间非常难以界定,专业间扯皮多,严重影响故障处理效率,也非常影响团队间的合作。

最后,云平台运维缺乏直接面向上层网元层业务质量的运维保障手段,基本处于被动消除告警的状态,网元层的DPI信令分析能力也止步于NFV网元SBI接口,对网元内部网络的运维保障存在短板。

对于大型分布式系统运行、维护、保障,团队的紧密沟通合作是极其重要,包括在SRE、DevOps等运维方法论中,均特别强调了团队的重要性。但在5G核心网的运维中,核心网与云平台的紧密沟通、协作还存在不小的挑战。以下举几个实际例子。

例子一:当PCF出问题的时候,核心网运维可能会联系云平台“我们这里的PCF服务不正常,看到服务器上有告警,你们赶紧处理一下”,而云平台运维可能会觉得“服务器的告警好像和PCF的服务异常没什么关系,是不是PCF软件出问题了?”

例子二:某个VNF升级之后,服务有异常,核心网运维查了半天也找不出原因,最后看到虚拟机有告警,反馈给网络云运维后,很可能得到这样的反馈“升级前后都有相同的告警,升级前没有问题,是不是你们新版本软件的原因?”

例子三:还有一种情况,当核心网发现VNF内部微服务有访问慢的情况,怀疑网络中存在丢包、拥塞问题时,反馈到云平台运维,而云平台的运维除了检查一下虚拟机、服务器的告警,再做一些ping测试验证,似乎也没有别的什么办法。

03未来:5GC三层解耦的阻塞点

与此同时,运营商集团公司还在努力推进5G核心网的三层解耦工作。所谓三层解耦,即5G核心网在硬件层、虚拟层、网元层真正解除厂商耦合、绑定关系,使得5G核心网真正的云化、云原生化。现阶段,移动、联通、电信基本采用两层解耦或者完全不解耦的建设模式。

三层解耦能够为5G核心网带来灵活泛在部署、弹性扩缩容、减少厂商依赖、增强竞争、降本增效等诸多好处,三层解耦一直是运营商非常

转载请注明:http://www.aideyishus.com/lkcf/689.html

------分隔线----------------------------

热点文章

  • 没有热点文章

推荐文章

  • 没有推荐文章