英伟达的 DPU,是想在数据中心奇袭英特尔?

创投圈
2020
10/17
19:08
脑极体
分享
评论

 

最近几年,经常关注科技圈的朋友们总会发现,每次遇到厂商有重大发布,就总能看到 " 颠覆 "、" 极致 "、" 革命性 " 等概念出现在发布会上。

前几天,iPhone12 的发布现场,蒂姆库克就用上了 " 新纪元 " 的字眼,准确地说应该是 iPhone 正式地步入了 5G 时代新纪元。但国内消费者对 5G 已经是见怪不怪了。苹果自嗨的划时代产品因为没有达到市场的预期,当日股价就跌去 3800 亿个小目标,后面就要靠销量来证明苹果自己有没有跨入 " 新纪元 " 了。

相比较于关注度高的消费电子领域,本文要把重点放在大多数人不太熟悉的数据中心产业,及其更上游的数据中心计算芯片上面。因为我们看到随着云计算的大规模普及和 AI 计算的指数级增长,数据中心被提到前所未有的重要位置。

最近在参加一个有关数字通信产业的论坛上,听到一位中国信通院的专家的观点是:数据中心,将成为和 5G 技术并肩,下一个数字技术的制高点。类似的观点,我们也在英伟达线上 2020 年 GPU 技术大会,从黄仁勋那里听到:数据中心已成为全新的计算单元。

黄仁勋之所以有这样的底气,就在于这次发布会上推出了一款全新处理器 DPU,以及围绕该处理器的软件生态架构 DOCA。据英伟达的介绍,DPU 可以和 CPU、GPU 相结合,构成完全可编程的单一 AI 计算单元,实现前所未有的安全性和算力支持。

那么,DPU 能否真正承担起与 CPU、GPU 一样的计算重要性,实现数据中心的一次巨大革新?其创新点到底在哪里?这些仍然是我们要去回顾和考察的问题。

英伟达 DPU 的过 " 芯 " 之处

从英伟达在 GTC 的介绍上来说,DPU(Data Processing Unit)处理器,其实是一种 SoC 芯片,其中集成了 ARM 处理器核、VLIW 矢量计算引擎和智能网卡的功能,主要应用在分布式存储、网络计算和网络安全领域。

DPU 的主要作用就在于替代了数据中心原本用来处理分布式存储和网络通信的 CPU 处理器资源。在 DPU 之前,智能网卡(SmartNIC)正在网络安全和网络互连协议方面逐渐取代 CPU。而现在 DPU 的出现,相当于是智能网卡的升级替代版本,一方面增强了智能网卡对网络安全和网络协议的处理能力,一方面又整合和加强了分布式存储的处理能力,从而在这两个领域更好地替代 CPU,从而释放 CPU 的算力给到其他更多应用。

英伟达在 DPU 上的技术突破,来自于去年收购以色列芯片制造公司 Mellanox 之后,在这家公司的硬件基础上开发出 BlueFeild 系列的两款 DPU ——英伟达 BlueField-2 DPU 与 BlueField-2X DPU。

据介绍,BlueField-2 DPU 具有英伟达 Mellanox Connext-6 SmartNIC 的所有特点,与 8 个 64 位的 A72ARM 处理器内核一起,实现可完全编程,并能提供每秒 200 千兆比特的数据传输速率,从而加速关键数据中心的安全、网络和存储任务。

最核心的一点是单个 BlueField-2 DPU 可以提供相当于消耗 125 个 CPU 内核所提供的数据中心服务,从而有效释放 CPU 内核的算力资源。

而 BlueField-2X DPU 则拥有包括 BlueField-2 DPU 的所有关键特性,其特性能够通过英伟达安培 GPU 的 AI 功能得以增强。而在英伟达的路线图里,未来的 Bluefield-4 将会引入 CUDA 和 NVIDIA AI,极大加快网络中计算机视觉应用处理的速度。

另外一个值得注意的是英伟达提出配合 DPU 处理器的软件开发工具包—— DOCA(Data-Center-Infrastructure-On-A-Chip Architecture)。英伟达的专家将 DOCA 类比为数据中心服务器领域的 CUDA,其意图在于帮助开发人员在 DPU 加速的数据中心基础设施上构建相应的应用程序,从而丰富 DPU 的应用开发生态。

从以上介绍我们看出英伟达的两个野心,一个是 DPU 试图再一次复制 "GPU 替代显示加速卡成为通用显示芯片的路径 ",再一个是 DOCA 试图再一次复制 "CUDA 在 GPU 通用化过程中所起到的开创生态之功 "。

如果和不久前英伟达收购 ARM 的消息结合起来,我们看到英伟达的一个重要考量,就是以 ARM 架构的 CPU 为核心,从服务器的应用加速扩展到服务器的全部应用场景,从而实现在数据中心服务器领域的更大突破,目标自然是剑指英特尔 CPU 为代表的 X86 服务器生态。

而在考察 DPU 挑战 CPU 霸主地位的可能性之前,我们可以简单来了解下英伟达在数据中心的布局。

英伟达的数据中心 " 野心 "

在经历过游戏显卡业务的增速放缓,以及加密货币退潮后带来的显著业绩下滑的影响之后,几经波折的英伟达终于坚定地将未来押注在了 AI 计算和数据中心的产业布局上面。

2017 年,英伟达的数据中心业务季度营收首次超过了 5 亿美元,同比增长了 109%,这使得黄仁勋在一次大会上大力肯定了数据中心业务的价值。

英伟达早在 2008 年,最初就是通过最早的 Tesla GPU 加速器和初级的 CUDA 编程环境来为数据中心进行 GPU 计算,试图将更多的并行计算从 CPU 卸载到 GPU 上。这成为英伟达 GPU 之后进化之路的一条长期策略。

此后随着 AI 计算需求在数据中心当中的爆发式增长,AI 硬件正成为越来越多数据中心扩容建设的关键所在。当超强 AI 算力成为数据中心的刚需,英伟达 GPU 凭借强大的并行计算和浮点能力,突破了深度学习的算力瓶颈,成为 AI 硬件的首选。这一契机才使得英伟达能够在数据中心的硬件版图上站稳脚跟,当然,英伟达的野心远不止于此。

英伟达最主要的布局就在于 2019 年 3 月,花费 69 亿美元收购了以色列芯片公司 Mellanox,而这家公司所擅长的正是为服务器、存储和超融合基础设施提供包括以太网交换机、芯片和 InfiniBand 智能互连解决方案在内的大量的数据中心产品。而英伟达的 GPU 与 Mellanox 的互连技术结合,可以使得数据中心工作负载将在整个计算、网络和存储堆栈中得以优化,并能实现更高的性能、更高的利用率和更低的运营成本。

当时,黄仁勋把 Mellanox 的技术看作是公司的 "X 因素 ",也就是把数据中心改造成一个可以解决高性能计算要求的大型处理器架构。而如今我们看到 DPU 的出现,已经是具有这一架构雏形的一种尝试了。

今年,英伟达花费 400 亿美金的天价从软银手中收购半导体设计公司 ARM,其意图之一就是要把 ARM 架构的 CPU 设计应用到英伟达所要搭建的未来计算模式中,主要布局的领域就有超算、自动驾驶和边缘计算模式。其中,基于英伟达 GPU 的 AI 运算平台与 ARM 的生态系统结合,将不仅能够强化英伟达高性能运算 ( HPC ) 技术能力,又可以带动英伟达数据中心业务营收持续创高。

可以说,英伟达在数据中心领域的成功与否,都与能否实现数据中心的规模化运算有关,从发展自研的 DGX 系列服务器到整合 Mellanox 的技术,再到借助 ARM 生态发展全新的数据中心计算架构,都是为转型数据中心业务所作的准备。

当然,想要实现这一目标,还要看下英特尔是否答应了。

英伟达挑战英特尔,距离还有多远

目前来说,数据中心当中,95%左右的 GPU 仍然还是连接到 x86 的 CPU 之上,英伟达如果单纯只是做 GPU 的增量,仍然无法撼动英特尔在数据中心服务器的霸主地位。现在,英伟达显然已经不满足于抓住增量市场,而是更希望能切入数据中心的存量市场,即设法用自己的芯片产品去取代英特尔(以及 AMD)主导的 X86 CPU。

自从英伟达开始收购 ARM,外界能够看到英伟达已经多次显示出其试图利用 ARM 处理器进一步占领数据中心服务器市场的决心,而集成了 ARM 核心的 DPU 将成为其打入数据中心存量市场取代 X86 CPU 的第一个切入点。

英伟达推出 DPU 来切入这个市场,而非直接用 ARM 核心 CPU 来与 X86 CPU 直接竞争,其实是一种比较讨巧的做法,相当于用集成了网络、存储、安全等任务的下一代 CPU 产品来达到逐渐替换 CPU 的目的,即使其中所内涵的 ARM CPU 性能无法对标同一代的 X86 CPU,但是整体机由于在 DPU SoC 上集成了专用的处理加速模块,因此总体性能一定是超过 X86 CPU 的。这种有点 " 田忌赛马 " 味道的策略,很可能成为英伟达开始替代低端 X86 CPU 的开始。

但是英伟达想要在中高端处理器市场来挑战英特尔,还要面临一系列的困难。

首先,正是英伟达的 GPU 与 X86 CPU 已经形成一种非常稳定的强互补关系。英伟达想要采用基于 ARM 架构的处理器做高端服务器,还需要 ARM 处理器性能出现大幅的提升,而现在,这一进程并不明朗。

再一个是英特尔早已为应对英伟达的种种挑战进行了相应的回应和布局。早在 2017 年,英特尔就宣布要开发全栈的 GPU 产品组合,而预计明年英特尔的首批 GPU 将在使用 GPU 的各个市场上发布。

为阻击英伟达在 AI 计算和自动驾驶领域的扩张,英特尔也先后收购了收购了 Nervana 和 Movidius 作为边缘 AI 计算的布局,收购了 Mobileye 作为自动驾驶的布局。并且,英特尔还在 2018 年宣布,将开发一个用于异构计算的全栈开放软件生态系统 OpenAPI 计划,来应对 CUDA 生态的扩张。也就是说,英特尔不仅在英伟达的后院搞事情,同时也在建立自身的 X86 服务器的生态系统。

数据中心业务对于英特尔来说,也正在成为其最核心的业务组成。2019 年 Q4 英特尔的数据中心业务超越 PC 业务,成为其收入的主要来源;而在今年,英特尔对其技术组织和执行团队的重组,也被外界视为全面转型数据中心业务的开始。

可以想见在未来的数据中心处理器业务上,英伟达将迎来英特尔最为强劲的保卫战和反击战,而广大的服务器集成商或将成为这场角力赛的受益方。

螳螂捕蝉,黄雀在后,英伟达还要面对 ADM 这一新对手的追赶。不久前 ADM 曝出要花费 300 亿美金收购赛灵思,就被看作是叫板英特尔,阻击英伟达的双战略。

除此之外,英伟达还要在数据中心处理器业务中面临来自客户自研芯片的挑战。云服务商本身也不愿意完全将自身的计算核心完全交给英伟达,无论是 AWS、还是谷歌、阿里巴巴、华为,都已经在布局自己的云端处理器。

不管怎么说,数据中心已经成为英特尔、英伟达、AMD 这些老牌芯片巨头未来争夺的主战场,而英伟达如何能够在 X86 的如日中天和云计算客户的自研路线中,找到一个切入到中高端服务器处理器的关键点,刚刚发布的 DPU 也只能算作一个初步的尝试。

未来数据中心的博弈,将围绕 AI、超算等所有领域全面展开,英伟达在前有强敌,后有追兵,盟友拥兵自立的境遇下,其数据中心的征程仍然任重而道远。

来源:脑极体

THE END
广告、内容合作请点击这里 寻求合作
免责声明:本文系转载,版权归原作者所有;旨在传递信息,不代表砍柴网的观点和立场。

相关热点

相关推荐

1
3