NVIDIA和英特尔通过HopperH100GPU和第四代XeonCPU为AI计算增压效率提升25倍

  • 发布时间:2023-01-11 11:31:00 来源:
标签:
导读 NVIDIA宣布推出其全新的HopperH100AIGPU系统,该系统配备了英特尔第四代至强SapphireRapidsCPU。NVIDIA借助由英特尔第四代至强蓝宝石激流CP

NVIDIA宣布推出其全新的HopperH100AIGPU系统,该系统配备了英特尔第四代至强“SapphireRapids”CPU。NVIDIA借助由英特尔第四代至强“蓝宝石激流”CPU提供支持的HopperH100AI系统提供25倍的高效率

新闻稿:人工智能是人类最具变革性创新的核心——从以前所未有的速度开发COVID疫苗和诊断癌症,到为自动驾驶汽车提供动力和了解气候变化。

几乎每个行业都将受益于采用人工智能,但随着神经网络复杂性的增加,该技术变得更加资源密集。为避免对发电产生不可持续的需求来运行此计算基础设施,底层技术必须尽可能高效。

由NVIDIAGPU和AI平台提供支持的加速计算提供了使数据中心能够可持续地推动下一代突破的效率。

现在,随着第四代英特尔至强可扩展处理器的推出,NVIDIA及其合作伙伴已经启动了新一代加速计算系统,这些系统专为高能效人工智能而构建。当与H100TensorCoreGPU结合使用时,这些系统可以提供比上一代产品更高的性能、更大的规模和更高的效率,从而提供更多的每瓦特计算和问题解决能力。

新的英特尔CPU将用于DGXH100系统,以及来自全球NVIDIA合作伙伴的60多台配备H100GPU的服务器。

提高企业AI的速度、效率和成本

即将推出的NVIDIA和英特尔驱动的系统将帮助企业运行工作负载的效率比传统的仅使用CPU的数据中心服务器平均高25倍。这种令人难以置信的每瓦性能意味着完成工作所需的功率更少,这有助于确保尽可能高效地使用数据中心可用的功率来增强最重要的工作。

与上一代加速系统相比,新一代NVIDIA加速服务器加快了训练和推理速度,将能源效率提高了3.5倍——这转化为实际成本节约,人工智能数据中心的总拥有成本降低了3倍以上。

新的第4代IntelXeonCPU的功能之一是支持PCIeGen5,它可以使从CPU到NVIDIAGPU和网络的数据传输速率提高一倍。增加的PCIe通道允许更高密度的GPU和每台服务器内的高速网络。

NVIDIA和英特尔通过HopperH100GPU和第四代XeonCPU为AI计算增压:效率提升25倍2

更快的内存带宽还可以提高AI等数据密集型工作负载的性能,而网络速度——每个连接高达每秒400吉比特(Gbps)——支持服务器和存储之间更快的数据传输。

配备H100PCIeGPU的NVIDIA合作伙伴的DGXH100系统和服务器附带NVIDIAAIEnterprise许可证,这是一套端到端、安全、云原生的AI开发和部署软件套件,为高效企业提供卓越的完整平台人工智能。

NVIDIADGXH100系统提高超大型AI的效率

作为全球首屈一指的专用人工智能基础设施的第四代,DGXH100系统提供了一个完全优化的平台,该平台由加速数据中心的操作系统NVIDIABaseCommand软件提供支持。

每个DGXH100系统都配备八个NVIDIAH100GPU、10个NVIDIAConnectX-7网络适配器和双第4代英特尔至强可扩展处理器,以提供构建大型生成式AI模型、大型语言模型、推荐系统等所需的性能。

NVIDIA和英特尔通过HopperH100GPU和第四代XeonCPU为AI计算增压:效率提升25倍3

结合NVIDIA网络,该架构通过提供比上一代高9倍的性能和比未加速的X86双路服务器高20到40倍的性能来大规模增强高效计算,用于AI训练和HPC工作负载。如果一个语言模型以前需要40天才能在纯X86服务器集群上进行训练,那么使用英特尔至强CPU和ConnectX-7驱动网络的NVIDIADGXH100可以在短短1-2天内完成同样的工作。

NVIDIADGXH100系统是企业级交钥匙NVIDIADGXSuperPOD的构建块,可提供高达1exaflop的AI性能,为大规模企业AI部署带来效率飞跃。

对于AI数据中心工作负载,NVIDIAH100GPU使企业能够更高效地构建和部署应用程序。

NVIDIA合作伙伴(包括华硕、源讯、思科、戴尔科技、富士通、技嘉、惠普)即将推出配备H100GPU和第四代英特尔至强可扩展CPU的广泛系统组合,为全球企业带来新一代性能和能效PackardEnterprise、联想、QCT和Supermicro。

作为未来效率提升的领头羊,配备NVIDIAH100GPU的FlatironInstitute的LenovoThinkSystem在最新的Green500榜单中名列前茅——NVIDIA技术为榜单前30名系统中的23个提供支持。Flatiron系统使用上一代英特尔CPU,因此预计现在上市的系统会提高效率。

此外,连接带有NVIDIAConnectX-7网络和英特尔第四代至强可扩展处理器的服务器将提高效率并减少基础设施和功耗。

NVIDIAConnectX-7适配器​​使用以太网或InfiniBand支持PCIeGen5和每个连接400Gbps,使服务器和存储之间的网络吞吐量翻倍。这些适配器支持高级网络、存储和安全卸载。ConnectX-7减少了所需的电缆和交换机端口数量,将大型GPU加速HPC和AI集群联网所需的电力节省了17%或更多,并有助于提高这些新服务器的能效。

NVIDIAAI企业软件提供全栈AI解决方案

这些下一代系统还针对NVIDIAAIEnterprise软件套件进行了优化,从而实现了运营效率的飞跃。

NVIDIAAIEnterprise在NVIDIAH100上运行,可加速数据科学管道并简化预测性AI模型的开发和部署,以自动化基本流程并从数据中获得快速洞察。

凭借广泛的全堆栈软件库,包括参考应用程序的AI工作流、框架、预训练模型和基础设施优化,该软件为扩大企业AI的成功奠定了理想的基础。

要试用NVIDIAH100运行NVIDIAAIEnterprise支持的AI工作流和框架,请免费注册NVIDIALaunchPad。观看NVIDIA创始人兼首席执行官黄仁勋在第四代英特尔至强可扩展处理器发布会上的演讲。

  • 免责声明:本文由用户上传,如有侵权请联系删除!