随着AI训练、高性能计算对网络低时延与高吞吐的需求激增,RoCE(RDMA overConverged Ethernet)技术已成为智算中心的核心底座。然而,传统无状态RoCE测试仅能验证设备基础功能,无法模拟真实业务场景的协议交互与动态负载,导致网络瓶颈难以暴露。
信而泰突破性推出有状态ROCE测试特性,实现真实的RoCE协议栈状态机模拟,为智算无损网络提供真场景、真压力、真诊断的评估方案,助力客户打造零隐患AI算力网络!
创新突破:有状态RoCE测试的技术价值
RoCE(RDMA over Converged Ethernet)作为数据中心网络的核心技术,在AI训练、高性能计算等场景中发挥着不可替代的作用。信而泰此次推出的有状态RoCE测试特性能够弥补无状态RoCE测试的不足之处,大大地完善与丰富智算无损网络的RoCE测试场景。
无状态VS有状态
无状态RoCE测试 | 有状态RoCE测试 | |
典型被测试对象 | 数据中心交换机 | 带有RoCE功能的xPU 网卡与芯片 |
测试模式 | 双臂测试 | 单臂测试 |
典型测试内容 | ECN功能与性能测试 PFC功能与性能测试 DCQCN功能与性能测试 xCCLover RoCE 功能与性能测试 | Send/Write/Read的带宽与时延测试 RC/UD 服务类型测试 QP最大数量测试 |
RoCE 协议真实性 | 无真实的RoCE协议状态交互 | 有真实的RoCE协议状态交互 |
有状态RoCE测试关键特性:
支持基于100G和25G速率的RoCE测试,未来还会增加400G和200G等其他速率的支持;
支持ib_send_bw、ib_send_lat、ib_write_bw、ib_write_lat、ib_read_bw、ib_read_lat、ib_atomic_bw、ib_atomic_lat测试用例;
支持RC和UD等服务类型,其中RC支持SEND first/Middle/Last/only、WRITE first/Middle/Last/only等;
支持每秒新建QP会话及QP会话并发的测试;
支持多打一、一打多、多打多 RoCE流量;
DarPeng 2000E整机支持8K以上 QP数量;
DarPeng 2000E整机支持190G以上 RoCE流量;
信而泰此次推出的有状态RoCE测试特性,突破性地实现了:
真实业务场景模拟:支持完整的RoCE协议栈状态机,精确还原实际应用环境;
动态负载测试:可模拟多样化的网络负载情况,验证设备在不同压力下的表现;
精准故障诊断:通过状态追踪,快速定位网络性能瓶颈和协议异常;
全方位性能评估:提供详尽的测试报告,包括延迟、吞吐量等关键指标。
场景赋能:完整而全面的RoCE测试特性
2024年已发布无状态RoCE测试特性,目前信而泰同时具备了有状态与无状态的RoCE测试特性,通过该特性能够针对以下的场景进行全面的测试与模拟:
1. AI训练中心:验证大规模分布式训练场景下的无损网络性能;
2.云数据中心:评估网络设备在无损网络中的实际表现;
3. 网络设备厂商:加速RoCE网络设备、网卡以及芯片的研发验证周期,提升产品质量;