成功案例

HPE Juniper Networking 构建新一代人工智能基础设施

为了扩展支持人工智能的网络,HPE Juniper Networking 需要在部署前,根据实际的人工智能工作负载需求验证数据中心交换机的性能。借助是德科技,HPE Juniper Networking 利用原生人工智能仿真和验证工具,对支持人工智能的基础设施进行了测试和优化。
测试

大规模验证人工智能网络性能

HPE Juniper 网络案例研究亮点

网络基础设施负责人

HPE Juniper Networking 为全球要求最为严苛的数据中心环境设计高性能网络平台。随着人工智能工作负载推动大规模 GPU 部署,客户对网络性能、扩展性和可靠性的要求日益提高。这些变化使得 HPE Juniper Networking 的数据中心基础设施成为影响 GPU 利用率、性能和成本效益的关键因素,这也使得在部署前验证支持人工智能的架构变得尤为重要。

验证部署性能

在客户部署之前,HPE Juniper Networking 需要验证高位元数 QFX5230 和 QFX5240 交换平台能否在真实的 AI 流量条件下可靠运行。AI 环境会产生持久且高带宽的流量流,即所谓的“大象流量”,与传统数据中心流量不同,这种流量会通过东西向流量对网络架构造成压力。 仿真技术可用于测试功能的基本行为,并验证命令行界面(CLI)参数的调整机制。面临的挑战在于,如何在不构建庞大的物理 GPU 集群的情况下,验证系统在这些特定于 AI 的条件下的性能表现。

原生AI流量仿真

借助专为人工智能数据中心打造的流量仿真平台AresONE,HPE Juniper Networking 成功以高达 800GE 的线速模拟了 RoCEv2 流量。 流量可能呈现突发性特征并展现特定模式,例如“全对全”(all-to-all)模式——即大量GPU试图相互发送数据,从而引发内播(in-cast)拥塞。通过重现AI特有的流量模式和GPU集群行为,HPE Juniper Networking得以模拟真实的拥塞、缓冲和负载均衡场景。 是德科技的解决方案通过模拟 GPU 和远程直接内存访问 (RDMA) 网络接口卡 (NIC),生成逼真的 AI 工作负载流量。这种方法使 HPE Juniper Networking 能够验证进阶 功能和运维控制,而无需部署大量物理 GPU,从而降低了风险并加快了客户环境的部署准备。

在人工智能大规模应用中表现卓越

借助是德科技(Keysight)的原生AI流量仿真技术,HPE Juniper Networking 对其高位元交换机在AI数据中心运行条件下的实际性能进行了验证和优化。这使HPE Juniper Networking 能够加快功能验证进程,并显著降低部署风险。最终,HPE Juniper Networking 展示了从数百个到数万个GPU环境下均可扩展且可靠的网络性能。
马赫什·苏布拉马尼安,瞻博网络人工智能数据中心产品管理总监

“与是德科技的合作,使我们能够提供值得信赖的网络基础设施,既能满足当今的需求,又能应对未来人工智能带来的挑战。”

HPE Juniper Networking 人工智能数据中心产品管理总监 Mahesh Subramaniam

了解 HPE Juniper Networking 使用的工具

探索相关资源

×

请销售人员联系我。

*表示必填字段

请选择您希望的是德科技与您沟通的方式*必填项
您更倾向于哪种沟通方式? 更改电子邮件地址?
您更倾向于哪种沟通方式?

请点击按钮,向是德科技提供您的个人数据。有关我们如何使用这些数据的信息,请参阅《是德科技隐私声明》 ,谢谢。

感谢您!

销售代表将尽快与您联系。