收藏 分享(赏)

东数西算下面向业务的路由策略分析与探索.pdf

上传人:爱文献爱资料 文档编号:21747699 上传时间:2024-04-21 格式:PDF 页数:5 大小:2.99MB
下载 相关 举报
东数西算下面向业务的路由策略分析与探索.pdf_第1页
第1页 / 共5页
东数西算下面向业务的路由策略分析与探索.pdf_第2页
第2页 / 共5页
东数西算下面向业务的路由策略分析与探索.pdf_第3页
第3页 / 共5页
亲,该文档总共5页,到这儿已超出免费预览范围,如果喜欢就下载吧!
资源描述

1、东数西算下面向业务的路由策略分析与探索魏汝翔 等热点专题中兴通讯技术2023 年 8 月 第 29 卷第 4 期 Aug.2023 Vol.29 No.4东数西算下面向业务的路由策略分析与探索Analysis and Exploration of Service Oriented Routing Strategies in East-Data-West-Computing Requirement Transfer魏汝翔/WEI Ruxiang,刘琦/LIU Qi,赵广/ZHAO Guang,曹畅/CAO Chang,唐雄燕/TANG Xiongyan(中国联合网络通信有限公司研究院,中国 北京

2、100048)(The Research Institute of China Unicom,Beijing 100048,China)DOI:10.12142/ZTETJ.202304004网络出版地址:http:/ on the demand of various services for computing power and network indicators,combined with the current status of network traffic and the future trends of network traffic development,the rout

3、ing strategy and implementation mechanism including computing power business are analyzed,and the routing strategy oriented to business and computing power distribution under the scenario of east-data-west-computing is explored.A hybrid routing strategy based on service attributes and computing powe

4、r resource distribution is proposed,which divides the whole region into several computing power regions.The centralized routing strategy is adopted between different computing power regions,and the distributed routing strategy is adopted within the computing power regions.The hybrid routing strategy

5、 can provide a secure,flexible,and efficient overall routing strategy.Keywords:east-data-west-computing;computing power network;computing power service;routing strategy引用格式:魏汝翔,刘琦,赵广,等.东数西算下面向业务的路由策略分析与探索 J.中兴通讯技术,2023,29(4):14-18.DOI:10.12142/ZTETJ.202304004Citation:WEI R X,LIU Q,ZHAO G,et al.Analy

6、sis and exploration of service oriented routing strategies in the east-data-west-computing requirement transfer J.ZTE technology journal,2023,29(4):14-18.DOI:10.12142/ZTETJ.2023040041 算力业务的需求指标和分类在数字经济时代,算力如同农业时代的水利、工业时代的电力,既是国民经济发展的重要基础,也是科技竞争的新焦点。算力是设备或平台为完成某种业务所具备的处理业务信息的关键核心能力,包括逻辑运算能力、并行计算能力、神经

7、网络加速能力等1-2。算力业务除了对上述算力资源有要求外,还会根据具体的业务类型,对网络的上下行带宽、时延、抖动、存储等方面有不同的要求。算力业务从应用的角度可以分为计算类、存储类、互动类,这3类业务会互相重叠、交叉3,一种算力业务经常同时属于上述多种分类。不同业务对算力与网络指标的要求不尽相同。总的来说,对于计算类与存储类等对网络时延与抖动要求不高的算力业务,适用于“东数西算”场景,可将海量数据传输到西部进行计算与存储;而对于互动类业务,不适用于东数西算,应合理利用边缘算力,就近提供服务。东数西算对传统基于距离的路由策略提出了新的需求。在路由决策时,不再将所有业务都分配到距离(包括跳数、开销

8、、时延等)最近的节点,而是综合考虑业务属性与算力资源的分布,在已知各类业务对网络指标、算力与存储需求的情况下,通过路由策略对各类业务进行分配:将对实时性要求较低的冷数据分配到西部算力枢纽节点,将对实时性有14东数西算下面向业务的路由策略分析与探索魏汝翔 等热点专题中兴通讯技术2023 年 8 月 第 29 卷第 4 期 Aug.2023 Vol.29 No.4一定要求的温数据分配到东部算力枢纽节点,将对实时性与可靠性要求较高的热数据分配到距离最近的边缘算力节点。2 现网流量对东数西算业务路由策略的影响当前电信运营商的网络流量主要以视频业务为主,预计未来网络流量中视频流量的占比将进一步增加。据O

9、mdia网络流量报告预测4,2019年视频流量占全球总流量的76%,到2024年,视频流量将占到总流量的80%。据爱立信移动市场报告预测5,到2025年,移动视频流量在移动数据总流量中的占比将从2019年的略高于60%增长到近75%。从用户角度来看,视频业务主要以下行流量为主。无论是当前主流的短视频、社交媒体视频等业务,还是不断发展的4K、8K等超高清视频点播类业务,均需要占用大量的网络下行带宽。此外,虚拟现实(VR)、混合现实(MR)等新兴业务也对网络的下行带宽提出了很高的要求。当前中国电信运营商城域网流量主要以下行流量为主。以中国联通为例,在城域网家庭宽带流量中,上行流量与下行流量比值大约

10、为13;在移动互联网流量中,上行流量与下行流量比值大约为17。据中国信息通信研究院的监测报告6,2022年第1季度,中国5G平均用户下载速率为304.8 Mbit/s、平均用户上传速率为49.6 Mbit/s;4G平均用户下载速率为 27.8 Mbit/s、平均用户上传速率为 2.9 Mbit/s;Wi-Fi平均用户下载速率为179.7 Mbit/s、平均用户上传速率为36.3 Mbit/s。当前主流的固网宽带业务、移动网络4G或5G业务、移动终端通过Wi-Fi上网等业务的下载速率远远高于上传速率。随着未来视频业务占比的不断增加,网络下行带宽与上行带宽仍然会存在利用率不均衡的问题。对于计算类与

11、存储类的算力业务,东数西算可以将东部的海量数据从用户侧通过网络传输到西部算力枢纽节点,这需要占用大量的网络上行带宽。对于以下行流量为主的电信运营商网络而言,东数西算刚好能够复用当前电信运营商的城域网带宽。此外,远程医疗、高清直播等业务对网络带宽的需求也主要集中在上行带宽。如果在路由决策时能够分开考虑上下行带宽利用率,电信运营商的网络带宽将会得到更充分的利用。因此,在路由决策时除了要满足业务对算力、时延、带宽等业务属性的需求外,还要充分、有效地利用电信运营商的网络资源以及国家算力枢纽节点的资源。3 算力业务的路由策略分析软件定义网络(SDN)的出现,给多业务场景中的路由策略制定提供了新的思路7。

12、SDN与传统网络的区别体现在转发平面和控制平面的解耦。相较于传统网络,SDN架构下的控制层可以利用编程的方法对数据层面的转发行为进行控制,从而更加灵活地管理网络。基于IPv6段路由(SRv6)可以实现报文转发路径的可编程。同时,采用SRv6技术可以简化网络结构,实现网络之间的无缝衔接。这使得路由能力不再割裂8,并可以结合SDN控制器实现业务的路由决策。基于SRv6算力路由技术的相关行业标准已完成初稿的编制,正在意见征求中。算力业务的集中式路由决策正是利用SDN与SRv6的思想,首先通过组合使用边界网关协议段路由连接状态(BGP-LS)、随流检测(iFIT)、Telemetry等技术,实现网络上

13、下行带宽利用率、时延、抖动、丢包率等网络指标的实时检测9;然后通过算力感知等技术获取全网的算力及存储信息;再根据不同业务对算力及网络性能的需求,通过控制器依次为各种业务分配最优路径。目前来看,算力业务的集中式路由决策的标准化及设备性能等都较为成熟1。集中式路由决策的方式需要控制系统掌握全网实时的详细信息,根据不同的业务类型以及用户对业务服务级别协议(SLA)的不同需求,将业务分配到能够满足用户对算力、存储及网络能力需要的节点。全网设备及链路众多,算力与网络信息的及时更新,对控制层的计算、存储都提出了较高的要求。例如,当因业务的分配或完成而导致网络指标或算力资源发生变化时,或因新设备上线、原设备

14、掉线以及链路通断状态的改变引起网络拓扑结构变化时,都需要控制层及时更新网络信息,重新完成路径规划再将信息下发至网络头节点。这一过程所需的时延会极大地影响用户体验,甚至影响业务的正常运行。与集中式路由决策相对的是分布式路由决策。分布式路由决策由网络中的路由器设备完成路由决策与转发。这其中的关键在于对算力的感知与标识,以及如何将计算能力与网络状态信息发布到全网。为了解决上述问题,计算优先网络(CFN)的概念被提出10-11。CFN延续了传统分布式路由协议的设计思路,通过对网络架构和协议的改进,将计算能力与网络资源作为路由信息发布到网络,并路由到相应的计算节点,从而实现计算能力与网络资源的优化和高效

15、利用。CFN的核心功能在于算力资源感知和算力任务调度。由电信运营商与部分业内主流厂商提出的算力网络 算力路由协议技术要求:OSPF协议扩展当前已在中国通信标准化协会(CCSA)立项。该标准定义了开放式最短路径优先(OSPF)相关协议的扩展选项,如OSPFv2/OSPFv3协议。这些协议能够携带算力信息和网络信息,推动了分布式算力路由决策的标准化工作。15东数西算下面向业务的路由策略分析与探索魏汝翔 等热点专题中兴通讯技术2023 年 8 月 第 29 卷第 4 期 Aug.2023 Vol.29 No.4分布式路由决策具有良好的扩展性,但实现起来比较复杂。目前,算力编排与网络控制等方面的标准化

16、工作还未完成12,距离应用还很远。此外,将算力服务标识、路径规划、路由决策等控制权交由网络中分散的节点设备,容易导致业务流量被篡改、攻击。两种路由决策的对比如表 1所示。目前,3家电信运营商联合高校、企业正在起草行业标准算力网络算力路由协议技术要求。该标准定义了算力信息和网络信息的感知和通告方法,给出集中式与分布式两种通告方式的优点及其应用场景,并重点针对算力网络集中式控制器提出相关的技术要求。随着算力网络国家枢纽节点的建设,算力资源将向三大区域集中:西部算力枢纽节点、东部算力枢纽节点、各地市的边缘算力节点。各区域的地理位置及它们之间的网络连接基本不变,但区域内部的算力资源与这些资源之间的网络

17、连接将随着算力网络的发展而不断变化。若采用集中式路由决策,那么上述算力资源与网络连接的频繁改变会严重影响控制器的信息更新与路径规划;若采用分布式路由决策,则无法通过全局统一的管控与路径规划来实现业务路径的全局最优。4 东数西算下面向业务的路由策略探索为了解决上述问题,本文中我们结合两种现有的路由策略,在东数西算场景下探索出一种基于业务属性与算力资源分布的混合式路由决策方式。我们将国家算力枢纽节点、区域边界节点等重要算力区域中的关键设备,以及电信运营商各城域网、骨干网中的核心设备集中管理。基于自身的分布式路由决策能力,这些关键设备能够感知所在的算力区域中各种网元设备的算力及相互网络指标等信息,然

18、后将这些信息上报给控制层,再由控制层统一进行集中式路由决策。这样可以将业务调度到全局最优的算力区域,再由以上的这些关键设备通过分布式路由决策以局部最优的方式调度到自身所在算力区域的具体网元中。例如,如果人们要去某个商业中心的餐厅用餐,首先用手机软件(相当于控制层)通过全局最佳路径导航到该商业中心(相当于集中式路由决策),再通过查看商业中心的内部楼层介绍或询问等方式选择局部最佳路径,从而到达餐厅(相当于分布式路由决策)。当区域内部算力或网络信息变化不大时,区域关键设备无须将这些信息实时上报给控制器,因此不会对全局集中式路由策略造成影响。通过设置区域资源告警,在区域内部算力资源不足或网络状态劣化达

19、到一定程度后,区域关键设备将算力或网络信息上报给控制器,并且在后续的集中式路由决策时不再将新业务调度到该算力区域。这样既可以大幅简化控制层所需要的全网设备及链路数量,又能在部分网络指标、拓扑结构或算力资源发生微小变化时,降低区域关键设备对控制层实时更新网络信息以及重新完成路径规划所造成的时延影响。基于业务属性与算力资源分布的混合式路由决策的算力与网络信息通告流程如图1所示。1)区域1、2、3中的所有路由器分别完成算力资源信息与网络指标信息的采集。需采集的信息包括各算力资源节点的逻辑运算能力、并行计算能力、神经网络加速能力等算力资源信息和其存储能力,以及路由器之间的链路上下行带宽及利用率、网络时

20、延、丢包率、抖动等网络指标信息。2)区域1、2、3中的关键设备(即路由器R10、R20、R30)分别通过BGP扩展协议等方式互相通告它们之间的网络连接状态信息。3)区域1、2、3中的所有路由器分别在各自区域内部将采集到的上述信息进行域内通告。待网络收敛后,所有路由器均生成了各自区域内部的算力服务路由表项。表1 集中式路由决策与分布式路由决策对比对比指标算法思想及关键技术路由策略的标准化程度对设备能力的要求网络与设备变动对路由决策的影响路径重新计算所需时间路径调整灵活性网络管理灵活性业务安全性路径规划效果集中式路由决策SDN、SRv6较高较高较大较长较复杂较灵活较好全局最优分布式路由决策CFN、

21、BGP较低较低较小较短较灵活较复杂较差局部最优BGP:边界网关协议CFN:计算优先网络SDN:软件定义网络SRv6:基于IPv6段路由控制层区域3算力节点23R32R30R31R33R13R12R14R10区域1区域2算力节点12算力节点11R11算力节点13R20R21R22R23算力节点22算力节点21图1 混合式路由决策的算力与网络信息通告示意图注:代表算力网络信息通告流程16东数西算下面向业务的路由策略分析与探索魏汝翔 等热点专题中兴通讯技术2023 年 8 月 第 29 卷第 4 期 Aug.2023 Vol.29 No.44)区域1、2、3中的关键设备将它们之间的连接信息与各自所在

22、区域的算力资源信息上报给控制层。在控制层进行集中式路由决策时,仅需考虑将业务分配到哪个区域。待业务到达目标区域的关键设备时,关键设备通过分布式路由决策,逐步将业务转发到区域内部最终的算力资源节点。当区域内部算力资源与网络状态的改变程度大于告警域值时(如内部大型算力节点故障或某条核心网络链路中断),该区域的关键设备将重新收敛后的算力与网络资源信息上报给控制层,从而使控制层能够根据最新的区域信息重新进行集中式路由决策;而当区域内部算力资源与网络状态的改变程度小于告警域值时(如内部小型算力节点故障或某条非核心网络链路中断),该区域的关键设备则无须将收敛后的算力与网络资源信息上报给控制层,这样不会对控

23、制层进行集中式路由决策造成影响,仅对业务到达目标区域后的分布式路由决策产生影响。我们通过以下4种典型的场景,介绍在东数西算背景下,基于业务属性与算力资源分布的混合式路由决策是如何将用户的业务分配到合适节点的,具体如图2所示。场景1:位于某西部地市的用户A希望使用车联网来实现自动驾驶业务。客户端则根据该用户选择的业务类型,判断出此业务对时延非常敏感,需要将此业务分配到离其物理位置最近的、时延最小的边缘算力节点,因此客户端决定采用分布式路由决策在区域内部进行分配,用户所属的路由器R21将该业务分配到边缘算力节点21。场景2:位于某东部地市某区县的用户B希望观看某高清视频。客户端根据该用户选择的业务

24、类型,判断出该用户所选业务对网络下行带宽要求很高,且用户希望观看的高清视频所在数据中心的位置与用户位于同一区域。因此客户端决定采用分布式路由决策将该业务分配到存储对应资源的数据中心,用户所属的路由器R41将该业务通过路由器R40分配到数据中心。场景3:位于某东部地市的用户C希望观看某高清视频。与上一场景类似,客户端判断出用户希望观看的高清视频所在数据中心与用户位于不同区域,因此决定首先采用分布式路由决策将业务通过路由器R31派往区域内的关键路由器R30,然后采用集中式路由决策将业务派往区域4的关键路由器R40。当业务到达R40后,再通过分布式路由决策,将其分配给存储对应资源的数据中心。场景4:

25、位于某东部地市的用户D希望备份大量的医疗影像数据并进行智能影像分析。客户端根据该用户选择的业务类型及服务级别,判断出该用户所选业务对网络的上行带宽要求很高,且需要一定的逻辑运算能力、并行计算能力以及存储能力,对网络时延无要求,因此决定将其分配给西部国家算力枢纽节点,实现东数西算。控制层根据当时掌握的全网算力与网络资源信息,以及用户所在的位置信息,通过集中式路由决策规划出业务大方向,即经过区域3的关键路由器R30到区域2的关键路由器R20,再到区域1的关键路由器R10。在区域3中,由用户所属的路由器R31到关键路由器R30的路径由分布式路由决策进行规划。因用户所属的路由器R31检测到其至路由器R

26、30的直连链路上联带宽利用率很高,而通过路由器R32到达路由器R30的链路上联带宽利用率很低。因此,路由器R31将业务通过路由器R32发送给区域3的关键路由器R30。核心算力节点11的并行计算能力与存储能力均不足以满足业务要求,而核心算力节点12的逻辑运算能力、并行计算能力、存储能力等性能均能满足业务要求。因此,当业务到达某西部国家算力枢纽节点所在区域1的关键路由器R10时,根据分布式路由决策,关键路由器R10将业务通过路由器R11分配到核心算力节点12。5 混合式路由决策的应用当前,由3家电信运营商联合行业知名企业共同起草的算力网络混合式组网技术要求已在CCSA立项。该标准综合集合式算力路由

27、与分布式算力路由的优点,提出了混合式算力路由技术方案:由上层控制器/编排层完成算力信息的收集与分发,将算力状态通过上层系统向网络节点设备进行扩散与通告,再由网络节点结合计算与网络状态进行路由决策及算力服务选择,同时结合操作维护管理(OAM)技术来实现算力服务可用性状态的实时通告。该方案主要针对车联网等时延要求高的场景,通过混合式算力路由技术实现路由的快速收敛,并形成可快速落地应用的现网部署技术方案。由于算力网络的快速发展及东数西算政策的加速实施,图2 4种场景中基于业务属性与算力资源分布的混合式路由决策示意图控制层区域2:某西部地市城域网区域3:某东部地市城域网区域4:某东部地市的某区县区域1

28、:某西部国家算力枢纽节点用户B边缘算力节点41数据中心R40R41边缘算力节点32边缘算力节点31R32R30R31上行带宽用户D用户C用户D用户A边缘算力节点21边缘算力节点12核心算力节点11算力资源R13R12R11R14R10R22R20R21边缘算力节点2217东数西算下面向业务的路由策略分析与探索魏汝翔 等热点专题中兴通讯技术2023 年 8 月 第 29 卷第 4 期 Aug.2023 Vol.29 No.4算力业务的数量逐步增加,面向算力网络路由决策技术的落地需求也相应增加。当前,CCSA算力网络 混合式组网技术要求的项目组正在开展面向车联网场景下基于该方案的原型研发,以混合式

29、算网一体路由调度为核心,立足具体应用场景,构建端到端的算网服务解决方案,赋能车联网等需求场景。目前该方案已具备三大核心技术能力:综合算+网因子进行服务选择及路径计算,为应用端提供最优算力服务;为终端的低时延应用提供快速调优的算力路由能力;提供网络层与应用层的移动业务连续性解决方案,实现无感知服务切换。后续我们将结合具体的实验环境进行应用部署与测试,以推动基于算力业务的算力网络混合式路由决策方案在现网场景中落地。6 结束语在中国东数西算政策支持下,通过路由决策将不同业务高效地分配到合适的位置,将成为算力网络发展的主要方向之一。本文中,我们首先梳理出各类业务对算力与网络指标的需求,分析、研究了包含

30、算力业务的路由策略与实现机制,在集中式路由决策与分布式路由决策的基础上,结合当前网络流量现状与未来网络流量发展趋势,探索出一种在东数西算场景下,基于业务属性与算力资源分布的混合式路由策略。该方法结合集中式与分布式两种路由策略的优势,适用于各类传统非算力业务与新型算力业务,能够提供一种安全、灵活、高效的全局路由策略。随着未来技术标准的不断完善及商业模式的逐步明确,算力网络的路由策略及其应用实现将得到进一步的研究和落地。致谢作者在本文写作中得到了中国联通研究院易昕昕、庞冉的帮助,谨致谢意!参考文献1 易昕昕,马贺荣,曹畅,等.算力网络可编程服务路由策略的分析与探讨 J.数据与计算发展前沿,2022

31、(5):23-322 李建飞,曹畅,李奥,等.算力网络中面向业务体验的算力建模 J.中兴通讯技术,2020,26(5):34-38,52.DOI:10.12142/ZTETJ.2020050073 邵杭青,马蕴颖,梁汗臣.算力调度关键要素及路径分析 J.江苏通信,2022,38(6):76-80.DOI:10.3969/j.issn.1007-9513.2022.06.0184 Omdia.Network traffic forecast report:2019-24 EB/OL.(2020-07-09)2023-05-20.https:/ 爱立信.爱立信移动市场报告 EB/OL.(2022-

32、06-30)2023-06-10.https:/ 中国信息通信研究院.2022年第一季度5G云测平台监测报告 EB/OL.(2022-05-06)2023-06-10.https:/ 李然.SDN环境下基于链路状态感知的路径优化方法研究 D.北京:北京邮电大学8 张帅,曹畅,唐雄燕.基于SRv6的算力网络技术体系研究 J.中兴通讯技术,2022,28(1):11-15.DOI:10.12142/ZTETJ.2022010059 陈佳明,方遒铿,罗家尧,等.面向云网融合的IP承载网时延选路及保障解决方案 J.邮 电 设 计 技 术,2022(4):43-46.DOI:10.12045/j.iss

33、n.1007-3043.2022.04.00810 IETF.Compute first networking(CFN)scenarios and requirement:draft-geng-rtgwg-cfn-req-00 S.202011 IETF.Framework of compute first networking(CFN):draft-li-rtgwgcfn-framework-00 S.202112 曹云飞,霍龙社,何涛.基于SRv6的可编排计算优先网络实现方法 J.邮电设计技术,2022(4):4-9.DOI:10.12045/j.issn.1007-3043.2022.0

34、4.002作者简介魏汝翔,中国联通研究院网络与信息化规划研究中心工程师;主要研究方向为IP网络演进、新一代城域网等。刘琦,中国联通研究院网络与信息化规划研究中心高级工程师;主要研究方向为网络长期演进及承载网规划,长期从事通信网络规划咨询、研究设计工作。赵广,中国联通研究院网络与信息化规划研究中心高级工程师;主要研究方向为IP网络演进、新一代城域网、IPTV的CDN等。曹畅,中国联通研究院未来网络研究部总监、第七届中国通信学会信息通信网络技术委员会委员、中国通信标准化协会“网络5.0技术标准推进委员会”架构组副组长、边缘计算网络基础设施联合工作组(ECNI)技术规范组组长;主要研究方向为IP网络宽带通信、SDN/NFV、新一代网络编排技术等;获中国联通科技进步奖2项;已发表论文30余篇,获授权专利10余项。唐雄燕,中国联通研究院副院长、首席科学家,“新世纪百千万人才工程”国家级人选,北京邮电大学兼职教授、博士生导师,工业和信息化部通信科技委委员兼传送与接入专家咨询组副组长,北京通信学会副理事长,中国通信学会理事兼信息通信网络技术委员会副主任,中国光学工程学会常务理事兼光通信与信息网络专家委员会主任,国际开放网络基金会ONF董事;拥有20余年电信新技术新业务研发与技术管理经验,主要专业领域为宽带通信、光纤传输、互联网/物联网、SDN/NFV与新一代网络等。18

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 学术论文 > 综合论文

本站链接:文库   一言   我酷   合作


客服QQ:2549714901微博号:文库网官方知乎号:文库网

经营许可证编号: 粤ICP备2021046453号世界地图

文库网官网©版权所有2025营业执照举报