东南教育网您的位置:首页 >互联网 >

什么是数据处理单元为什么要关心

导读 随着Nvidia Corp 的GPU技术大会在星期一开始,最有趣的产品公告之一是引入了数据处理单元,也称为DPU。英伟达被公认为图形处理单元的市场

随着Nvidia Corp.的GPU技术大会在星期一开始,最有趣的产品公告之一是引入了数据处理单元,也称为DPU。

英伟达被公认为图形处理单元的市场领导者,并且最近宣布了计划收购Arm Ltd.的计划,以转移到中央处理单元或CPU中。现在,它正在推销称为DOCA或片上数据中心的产品,该体系结构可提高数据中心网络,安全性和存储的性能。

关于DPU的一种简单思考方法是,它已经增强了网络接口卡或NIC的性能,可以执行服务器上CPU所执行的许多任务-SmartNIC,如VMware Inc.在与Nvidia的公告中所说的那样。上个星期。 通过卸载这些功能,服务器可以处理更多的裸机,虚拟或容器化工作负载。 在传统体系结构中,NIC处理基本的网络功能,而服务器上的CPU执行诸如基础结构管理以及软件定义的存储,安全性和网络等任务。

借助DPU,Nvidia已采用了Mellanox NIC,并在其中加载了芯片和软件以提高服务器性能。在GTC上,Nvidia宣布了两种DPU:

BlueField-2 DPU是具有ARM内核的Mellanox ConnectX-6 DX SmartNIC。 “卡”(实际上是板上的服务器)是完全可编程的,具有每秒200 GB的数据传输速率,并加速了网络,安全和存储功能,例如分段,根信任,密钥管理,RDMA / RoCE,块存储和压缩。

BlueField-2X是Bluefield-2,但上面装有Nvidia的用于人工智能目的的Ampere GPU。

英伟达企业计算部门负责人Manuvir Das在与分析师的会前电话会议中做出了一个大胆的预测,即“每台运入数据中心的服务器”都将装有DPU。 尽管 我认为这种说法有点激进,但我确实认为DPU会获得很大的吸引力。

基本的BlueField非常适合具有高密度虚拟机或容器的服务器。 BlueField-2X是更有趣的产品,因为它可以大大提高执行AI任务的服务器。 实时的安全分析是其中一项低落的水果用例,其中的AI用于识别可能表明违规的异常流量。 使用AI和DPU,可以以线速完成该任务,从而限制了安全事件的影响。

具有额外处理功能的NIC并不是真正的概念,但是Nvidia的时机很好。 对于那些已经从事该行业一段时间的人来说,可能还记得带有嵌入式防火墙的3Com NIC或Chelsio和Intel TOE(TCP卸载引擎),它们改善了卡上的网络处理能力。 这些是DPU的早期版本,惨遭失败。 这次有什么不同?

过去,我曾经认为TOE和类似的其他产品是个好主意,但在某种程度上却是解决问题的解决方案。 十年前,平均服务器利用率不到40%,因此,当服务器甚至没有接近极限时,没有太多理由从服务器上卸载处理。

如今,情况并非如此,因为虚拟化和容器已将服务器推向极限。实际上,与我交谈过的许多企业都在升级之前将服务器利用率推高到90%。 更换服务器可能会造成很大的破坏,并可能导致不必要的停机,因此公司会尽可能地将其淘汰。放下这些DPU之一可以将服务器的寿命延长数月甚至数年。

由AI驱动的另一个因素推动了对更快计算的需求。 Nvidia首席执行官Jensen Huang在GTC主题演讲中指出,“人工智能的并行度大大提高,而计算密集度则提高了数千到数百万倍。开发软件的方法不同。计算基础架构是不同的。工具不同。软件运行方式不同,甚至部署方法也不同。人工智能需要彻底改造计算堆栈。” DPU通过将资源移出服务器来使计算堆栈发生变化,从而使服务器可以执行其设计要执行的更多工作。

使我相信DPU可以保留的因素是生态系统支持。上周在VMWorld上,VMware宣布将在其Cloud Foundation中使用DPU。除VMware外,Red Hat,Canonical和Check Point Software还宣布了对DPU的支持。另外,包括戴尔,华硕,联想和超微在内的许多服务器制造商将把Nvidia DPU集成到他们的系统中。

进入数据中心的任何技术都必须具有强大的生态系统,因为它需要与许多其他组件一起工作。 最初的类似显卡浪潮实际上没有第三方支持,但Nvidia BlueField似乎有很多支持。

大小公司的信息技术专业人士都担心要从已经花费的美元中挤出更多资金。 今天的服务器所执行的工作负载比几年前要处理得多。 DPU可以为那些相同的服务器提供急需的性能提升,从而使企业进入AI时代。

免责声明:本文由用户上传,如有侵权请联系删除!