随着云计算、人工智能和高性能计算的不断进步,各种通用计算、智能计算和超级计算中心快速涌现。在这样的背景下,如何在不同的数据中心内部以及跨数据中心高效且可靠地传输数据,构建大带宽、低时延、高可靠的算力网络,成为“东数西算”政策布局的关键问题之一。
为了推动算力网络的发展和进步,我们策划了本期的算力网络专题,从多个角度对算力网络进行了深入探讨,包括算力网络的内部和外部组网、算力的感知与度量、高速光模块技术以及算力网络的安全问题等。希望本专题能为读者提供有益的参考和启示。
查看全文>算力度量与建模技术作为算力网络发展的重要基础,通过统一建模算力需求和资源,结合网络性能指标,形成算网能力模板,为算力路由、管理和计费提供统一度量标准。深入探讨了该技术的发展趋势与挑战,分析了算力网络发展中的算力度量需求。在此基础上对算力网络各层级进行抽象建模,设计了一种基于任务基本处理单元的算力度量和管理方法,并提出了一套完善的算力度量与建模体系,为算力网络的进一步发展提供了有力支撑和新的思路。
AI智算技术的高速发展驱动高速光模块需求量激增,大规模数据处理、大模型训练和推理等任务对高速光模块提出了前所未有的高要求。通过分析大模型训练的分布式并行计算需求,建立通信模型,并以GPT-3为例定量分析大模型通信量,由于通信量巨大,完成大模型训练的数据通信时间远高于并行计算时间。因此,在不降低计算性能的前提下,降低通信时间成为AI智算对通信网络的核心诉求,而采用更高速率的光模块互联、提升有效带宽是解决问题的主要途径。AI智算对高速光模块技术的需求将主要体现在更高速率、更大规模、高集约化、低功耗、高稳定性以及可管可控等方面。
互联网应用在服务端的算力分布会对用户感知产生一定影响。选取互联网头部应用,以流量作为主要度量,通过采集和分析现网数据,研究其服务端的算力分布情况和流量远距离绕转情况。同时,结合用户感知数据,对流量绕转与实际感知进行关联分析。分析发现,互联网应用的服务端算力分布存在不平衡现象,服务调度中也存在非最优调度。互联网应用方应与运营商密切协作,减少流量绕转,协同改善用户感知和网络效率。
算力网络作为全新的网络基础设施,其新型网络架构、多样化的服务场景以及新技术的应用,给算力网络安全带来了新的风险和需求。介绍了算力网络的发展机遇,分析了算力网络新的安全挑战,提出了算力网络安全能力框架,并探讨了解决相关安全风险的算力网络安全能力部署建议。
当前算力需求爆发式增长,通用计算也朝着人工智能计算的方向演进,新型智算中心网络作为算力间数据交互的中心,成为影响算力性能发挥的关键。分析了智算中心对网络的需求,对网络协议、架构和运维管理等方面进行了深入研究,并结合业界发展情况,给出了智算中心组网方案的建议。
通过分析数据中心算力资源和热力能流的耦合机制与潜在影响,建立算力能量融合流模型。以此模型为基础,构建基线控制、非协同控制和协同控制这3类典型数据中心能效控制策略。通过对3种控制策略在不同仿真场景下的模拟,分析能效优化结果的关键影响因素。最后,定义算力-能效指数作为数据中心算力分布与热力效应耦合程度的衡量标准,并阐述如何量化协同控制策略的潜在影响。
随着算力网络的兴起,传输网络面临新的挑战和需求,需要不断优化和升级以适应新的业务和技术要求。从优化网络结构、扩展网络带宽、降低业务时延、提升网络智能化水平等方面出发,探讨如何构建承载算力基础网络底座,为算力网络的未来发展提供高效可靠的传输支持,助力算力网络的创新应用和发展。
准确的无线传播模型不仅有利于网络规划、评估网络性能,更有利于后期网络调优、提高网络质量。通过南方某地(市)的模型校正案例说明传播模型的校正过程,主要包括测试准备、数据采集、数据处理和模型校正 4 个阶段,并通过同城同场景和异城同场景交叉验证模型的有效性和可靠性,为网络规划和建设提供重要依据和支撑。
3G网络简化可以腾退优质频谱资源、节能增效、提升网络性能。针对3G网络简化需要解决的问题,归纳总结国外运营商网络精简经验,为我国运营商网络简化提供参考;并以某运营商2022年底数据为例,分析3G网络覆盖情况、网络用户及业务承载情况,构筑端、网、业协同模型,评估了3G退网可行性及节奏;从网络侧和市场侧2个方面提出了相应的保障措施,推进网络简化,确保用户感知、网络覆盖不下降,顺利过渡到4G/5G网络。
5G网络覆盖是运营商保持竞争力的首要条件,如何快速掌握真实用户的覆盖情况、体验感知及位置尤为重要。利用O域MR、工参及DT路测数据,通过PNN算法构建5G道路高精准定位能力,将室外道路平均定位误差提升至50m左右,为实现5G道路免测试功能奠定了基础。
通过对当前物联网的安全威胁进行深入分析,发现SIM卡安全方案在实际使用过程中存在的一些问题。鉴于此,结合安全元件(SE)的 SPI接口优点,设计了SPI接口应用在SIM卡上的全新方案,详述了该方案的软硬件架构,最后阐述了该方案在实际应用中所具有的优势。
ROADM 传输系统以其灵活高效的特点,显著提升了网络性能,促进了业务发展。然而,维护人员在进行数据配置或网络维护时,无法自动计算最优路径,只能半自动或人工规划路由,效率低且准确性差。提出基于DFS计算ROADM网络最优路径的方法。该方法的主要思想是将ROADM网络抽象为无向图,将最优路径计算问题简化为求解无向图的最短路径问题,并扩展了经典的DFS算法以适应现网情况。该方法准确性高、灵活性好、扩展性大、安全性强。
G.654.E微型光缆作为一种全新的光缆类型,尚未在国内各大运营商干线光缆网中规模应用。为了验证G.654.E微型光缆的可用性,中国联通组织了相关厂商制作样品并进行测试。深入分析了测试数据,从结构尺寸、PMD 参数、机械性能、温度循环特性等7个方面论证了G.654.E微型光缆的性能指标,为该型光缆在中国联通骨干光缆网中的应用提供试验基础,同时也为其他运营商的使用提供参考。
中国5G独立组网(SA)互联网网络已经全面进入了IPv4和IPv6双栈运行阶段,但如何引入 IPv6 单栈,成为当前运营商面临的新挑战。通过对 IPv6 单栈概念和技术的分析,提出了IPv6单栈网络部署方案,并进行了实践验证。实践证明,该方案是可行的。随着业务应用由 IPv4 向 IPv6 演进,IPv6 的流量占比将大幅提升,基于实践和分析,提出了下一步IPv6发展的策略建议。
传统的故障分析手段将运维经验固化为故障分析规则或脚本,这种方式针对特定故障模式较为有效,但是无法应对新网络业务、组网变化,一旦规则、脚本需要调整,需投入较大成本进行适配改造,且时效性较差。而人工智能技术在大数据统计、分析、推理、自适应学习上有着先天优势,能快速基于新网络、新业务的变化重训练AI模型参数,给出最佳推荐值。基于此,重点研究了如何利用人工智能提升运营商故障分析能力。
为保障用户安宁权,解决现有的垃圾短信溯源效果不佳,用户被大量垃圾信息骚扰的难题,通过对区块链技术在行业短信领域的研究,基于区块链技术公开透明、不可篡改、可追溯的特性,探索用于行业短信应用场景的区块链短信技术。同时,研发了一套基于联盟链技术的区块链短信平台,实现了行业短信全流程上链以及行业短信全程可溯源。通过测试,平台的性能和扩展性能够满足某运营商全行业短信业务需求,取得了较好的效果。
随着云计算的迅猛发展,云资源池主要流量方式发生变化,传统的三层网络架构的局限性日益凸显。具有扁平化设计的叶脊(Spine-leaf)二层架构更能适应大量东西向流量的需求,并具有高可靠、低时延、无阻塞等优点。以云资源池的构建为研究对象,对传统的三层网络架构与新型的叶脊架构进行对比分析。并提出了使用叶脊架构构建云资源池的具体实施方案。
AI算力需求的爆发给智算数据中心系统建设带来高功率、散热难、转型困难等挑战。探讨了一体化电源系统的技术革新及其在提升智算中心使用效率、建设效率、运行可靠性与安全性方面发挥的作用。提出了一体化电源解决方案,并结合实际案例分析,证明该方案在系统集成性、稳定性、可靠保护机制以及对数据中心整体安全策略方面具有显著的优势,其智能化管理平台支持实时监测、数据分析与决策,对于预防潜在风险、提高应急响应速度具有重要意义。
Copyright©1999-2025 c114 All Rights Reserved | 沪ICP备12002291号
C114 中国通信网 版权所有 举报电话:021-54451141