英伟达声称实时对话AI取得新突破
Nvidia Corp.声称在人工智能方面又有一个重大突破,这次在语言理解方面创造了新记录,可以在各种软件应用程序中实现实时对话式AI。
Nvidia表示,实时对话AI是想要建立聊天机器人和虚拟助手的公司的必备工具,这些聊天机器人和虚拟助手可以与真实的人进行对话,同时展现出“人类层面”的理解力。
英伟达应用深度学习研究副总裁布莱恩·卡坦扎罗(Bryan Catanzaro)在新闻发布会上说:“对话式AI在全世界拥有大量应用程序。” “但这带来了很多挑战。业界一直在朝着更大的语言模型发展,但是它们很难训练和部署。”
最新的里程碑包括将最先进的AI语言模型之一《变形金刚的双向编码器表示》的培训时间从几天缩短到53分钟。Nvidia的系统还能够将完成AI推理所需的时间缩短到仅两毫秒,这足以应付人们期望的那种快节奏的对话。
该公司表示,通过使用优化的软件及其DGX SuperPOD系统,在不到一小时的时间内对BERT-Base进行培训就创下了世界纪录,该过程可能需要数周的时间。
Catanzaro说,Nvidia的TensorRT平台以仅2毫秒的延迟就创下了BERT推理的世界纪录,完全在人类水平精度要求的10毫秒阈值之内。
通过最新的突破,Nvidia的目标无非是推动“下一波对话式AI”的发展,而Catanzaro说,该公司已经在这一方面取得了稳固的进展。
例如,英伟达一直与Microsoft Corp.密切合作,以在Bing中驱动更准确的搜索结果。
“ Bing与Nvidia紧密合作,使用Azure AI基础架构的一部分Nvidia GPU进一步优化了流行的自然语言模型BERT的推理,这导致了去年Bing部署的搜索质量Bing的最大改进,” Microsoft Bing Group程序经理Rangan Majumder在一份声明中说。“与基于CPU的平台相比,使用Azure Nvidia GPU进行推理时,延迟减少了两倍,吞吐量提高了五倍,这使Bing可以为全球所有客户提供更相关,更具成本效益的实时搜索体验。 ”
Constellation Research Inc.分析师Holger Mueller表示,英伟达在对话式AI方面的进步非常重要,因为该技术正在改变人们与软件和设备进行通信的方式,并将对企业工作的未来产生重大影响。
穆勒说:“人工智能平台的竞赛正在进行中,诸如模型训练和执行速度之类的因素决定了获胜者。”
他还说,与微软的合作对两家公司都是一个关键的胜利。就Nvidia而言,这是因为Google LLC和Amazon Web Services Inc.都在构建自己的AI芯片,因此不太可能使用其硬件。他说,但是让公有云公司采用其硬件对于Nvidia的长期成功很重要。
“对于微软来说,它需要合作伙伴,因为它尚未在内部实现将算法应用于硅片的努力,至少目前还没有,”穆勒说。“微软在Azure上倡导的现场可编程门阵列并未涵盖对话型AI迅速发展的领域。”
Nvidia表示,它已经对其AI平台进行了许多优化,以实现其在对话式AI中的突破,现在该技术已提供给开发人员。优化包括在PyTorch上提供的新BERT训练代码(已在GitHub上提供)和TensorRT优化的BERT示例(也已开源)。