为什么测试 AI 推理部署很重要？

在AI模型从构建、训练到生产部署的全生命周期中，AI推理占据了成本的大部分。为了确保顺利上线，必须在投入生产前对AI推理基础设施和技术栈进行全面测试，以便尽早发现性能瓶颈和扩展限制，并得出更准确的成本估算。Keysight AI 构建器专为此领域打造，能够揭示整个路径中的瓶颈：从前端 ALB/WAF/AI 安全网关，到 SmartNIC/DPU，再到 GPU、KV 缓存、内存带宽和服务队列，精准定位延迟、故障或可扩展性限制的根源，从而实现精确调优和更明智的架构选择。

如何对 AI 推理部署进行基准测试？

对 AI 推理部署进行基准测试，需要能够在大规模、多种环境中模拟真实 AI 工作负载并提供有意义的 KPI 的测试解决方案。AI 推理基础设施可以利用各种公有云或高度定制的私有部署。因此，应选用既能通过虚拟流量代理生成推理流量，又能利用专用硬件的测试工具。尽管许多工具难以满足这些严苛的要求，Keysight AI 构建器（Keysight AI Builder）配备了轻量级流量生成代理，不仅能在虚拟和物理部署环境中大规模真实模拟 AI 推理工作负载，还能提供实时统计数据。该工具可通过统一、可重复的基准测试场景，对比多种 AI 基础设施组件（LLM 引擎、编排器、SmartNIC、ALB/WAF、AI 安全网关、GPU/TPU），从而降低架构选择的风险，进而支持数据驱动的决策。

如何为 AI 推理测试模拟真实的人工智能工作负载？

要模拟真实的AI工作负载以进行推理测试，仅发送简单的HTTP提示是不够的。这需要对各行业（例如金融、法律）中真实的用户画像进行深入研究，因为每种提示的结构都可能以独特的方式影响涵盖GPU、内存容量或带宽的推理栈。Keysight AI （Keysight AI ）通过精心编排的提示模型和工作负载库，能够帮助优化网络、硬件选择、模型服务层、引擎、编排器以及 GPU/内存使用。该库反映了跨行业和应用类型（例如金融、法律）的实际使用模式，以及技术基准（例如 GPU 计算、内存）。

对于 AI 推理验证而言，哪些指标至关重要？

验证 AI 推理部署需要从客户端视角、网络传输以及至关重要的服务栈视角，全面分析各项统计数据。在此背景下，能够通过单一视图同时查看客户端和服务器视角的推理原生 KPI，对于发现 AI 推理栈中隐藏的瓶颈和低效问题至关重要。Keysight AI 构建器（Keysight AI ）能够将客户端指标与推理引擎级遥测数据（例如 VLLM 统计数据）以及系统级 GPU 遥测数据（例如 DCGM 数据）进行前所未有的关联，并将它们整合在一个时间同步的视图中。这些统计数据包括并发用户数、首次令牌时间、最后令牌时间、每秒提示词数、令牌速率、预填充和解码时间、缓存利用率、调度器状态、GPU功耗以及张量核心使用情况。

如何确保人工智能推理部署具备可扩展性、稳健性和弹性？

要实现可扩展、稳健且具有高韧性的 AI 推理部署，必须借助能够轻松扩展至生产级用户并发量、对生成的流量负载进行精细控制，并为动态组合的代表性测试场景提供全面自动化功能的工具，进行严格的验证。Keysight AI 构建器（Keysight AI Builder）通过模拟数百万用户来加速容量规划并控制成本，在生产级负载下评估 AI 推理基础设施和软件堆栈，同时对生成的测试负载（即每秒提示次数）进行精细控制。它通过全自动测试场景，支持对 AI 推理基础设施和堆栈进行无与伦比的韧性和健壮性测试，适用于重复性的短时测试或长时间的压力测试。

KAI 推理构建器

这是您想要的页面. 查看搜索结果:

常用配置

打造我的产品

概述
所有型号
附件
软件
支持

接下来

验证和优化 AI 推理基础设施

KAI Inference Builder（KAI IB）是一款仿真与分析解决方案，旨在通过高保真、大规模地模拟真实的人工智能工作负载，对人工智能推理基础设施和软件堆栈进行验证、基准测试和优化，从而深入洞察推理系统的性能特征、功能及安全效能。

逼真的 AI 推理工作负载仿真

模拟真实的AI大型语言模型（LLM）推理流量——与真实用户的行为和工作负载相匹配——以便在模拟生产环境的条件下（而非合成实验室测试）验证推理基础设施和技术栈。

大规模流量仿真

支持数百万用户或每秒数百万次提示，从而量化真实的用户并发量，将性能与每令牌成本挂钩，并帮助团队准确规划容量和投资回报率。

私有云或公有云部署选项

通过完全虚拟化或基于硬件的推理客户端仿真，对部署在私有云或公有云上的 AI 推理基础设施进行验证。

单一视图统计界面

通过整合客户端视角的推断原生指标与从服务器采集的统计数据，实现统一视图，从而更快地定位瓶颈并简化优化流程。

介绍Keysight AI KAI）推理构建器

KAI Inference Builder 是一款具备推理感知能力的仿真与分析解决方案，旨在针对实际工作负载条件对 AI 推理基础设施进行验证、基准测试和优化。KAI Inference Builder 通过在 AI 数据中心部署中引入具备工作负载感知能力的全栈验证，帮助团队突破合成基准测试和通用负载测试的局限。