争夺 AI 底层框架,大厂进入新赛点

创投圈
2022
07/02
19:53
分享
评论

得底层创新者,得天下。

智能手机时代,PC 巨头微软,试图与苹果 iOS、谷歌Android 进行 " 三国杀 ";AI 时代,在深度学习底层框架的江湖中,谷歌和 Meta 你追我赶,互不让步。

由于 AI 底层框架投入资金量大、风险大,所以几乎只有不差钱的科技巨头才有实力投入重金,如国外谷歌的 TensorFlow 和 Meta 的 PyTorch,国内百度的 PaddlePaddle。

" 实力雄厚的美国互联网巨头对 AI 底层技术战略性投入力度较大,但中国的 AI 产业主要受需求拉动,大多数 AI 公司布局应用层。国内大部分公司的 AI 研发都选择使用外资巨头开源的 TensorFlow、PyTorch 等深度学习底层框架。" 中金基金在研究报告中表示。

AI 底层框架之争,纵有 TensorFlow、PyTorch、Keras、Caffe、MxNet 百花齐放,但最终还属谷歌和 Meta 两分天下。如今,TensorFlow 与 PyTorch 几乎平分春色。

近日,外媒 Business Insider 采访了一系列开发人员、硬件专家、云供应商以及与谷歌机器学习工作关系密切的人,获得了同样的观点:2015 年诞生的 TensorFlow,曾经辉煌一时,而 Meta 在 2017 年开源的 PyTorch 正在成为该领域的霸主,在此战争中,谷歌开始押宝 JAX。

随后,TensorFlow 官方博客回应,没有放弃 TensorFlow,将与 JAX 并肩发展。

虽然谷歌否认,但这个曾经帮谷歌打赢李世石,让谷歌AI 一战成名的 AI 框架,已经开始跌落神坛。

不过,谷歌试图通过 " 自我革命 " 来重现当年 TensorFlow 一统天下的雄风,这个艰巨的任务则由新的深度学习框架 JAX 实现。Google Brain、DeepMind、DALL · E Mini 等等的背后都有 JAX 的身影。据《商业内幕》透露,预计在未来几年内,JAX 将覆盖谷歌所有采用机器学习技术的产品。

从 TensorFlow 到 JAX, 随着 AI 发展阶段的变化,底层框架的创新和上层应用的关系也在发生微妙的变化。

" 传统的技术研究是从底层入手,逐渐发展,最后形成 demo 或产品业务,但现在应用层的业务需求可以反馈影响到底层设计。" 作为技术人员,林吉向光锥智能分享了对 AI 行业阶段性变化的观察。人工智能科学 LeCun 也曾公开表示,深度学习框架之间的激烈竞争,已经进入了一个新的阶段。

大厂的 AI 底层框架之争,是一场与时俱进的 AI 基础设施建设军备赛。

01 迎战 PyTorch,TensorFlow 落寞

曾几何时,Tensorflow 有多红?数据显示,截止到 2020 年 11 月,TensorFlow 的下载次数已经达到了 1.6 亿次。

" 孩子今年开学已经上小学五年级了,现在报课外班学 Tensorflow 还来得及吗?"

2018 年,知乎上一个提问吸引了亚马逊首席科学家李沐的回答:" 有点晚。我家娃一岁开始就开始读读 paper,现在已经可以熟练敲键盘写 MXNet 代码,虽然语法错误还比较多。他妈妈在 Google 上班是用 Tensorflow,但他对 MXNet 兴趣更大一点。不过比起敲代码,调参他更在行。"

图:李沐在知乎上的回答截图

AI 大牛亲自下场造梗,引得众人讨论。

2015 年 10 月,Tensorflow 面世,不到半年就名声大噪。2016 年 3 月,AlphaGo 与围棋世界冠军、职业九段棋手李世石进行围棋人机大战,以 4 比 1 的总比分获胜,背后的核心底层框架 Tensorflow 火速出圈,成为 AI 领域的崭新黑马。2017 年 5 月,在中国乌镇围棋峰会上,AlphaGo 与排名世界第一的世界围棋冠军柯洁对战,以 3 比 0 的总比分获胜。

彼时,Tensorflow 发展如日中天,AI 江湖以其为旗帜,打开任意一家 AI 创业公司的官网产品技术介绍信息,"Tensorflow" 都可能出现在显著位置。

但是,Tensorflow 独占鳌头的高光时期很快收到来自当时 Facebook 人工智能研究院的 " 战书 "。2017 年,后者基于 Torch 推出了 PyTorch。

如果说 Tensorflow 是 AI 底层框架领域的阳春白雪,PyTorch 就是下里巴人。

" 做个类比,PyTorch 就像 Python,TensorFlow 就像 Java。从使用者的角度看,我特别不喜欢 Java,因为干一个事之前要干很多事,上手门槛比较高,部署起来也比较麻烦,但是其底层运行效率非常高,Python 则是任何一个学生都特别容易上手,但 Python 对于服务器,对于计算资源的协调使用效率其实非常低。"

人工智能企业 Voil à ! 的创始人尚可总结道:TensorFlow 性能高但门槛也高,PyTorch 的优势则是更易用。" 圈内有句玩笑话:TensorFlow 什么都好,就是不好用。实际上一旦部署起来,整体运行效率比 PyTorch 高。"

因为 " 好用 " 的优势,PyTorch 迅速成为 TensorFlow 的强劲对手。据量子位报道的数据显示,2019 年,有 55% 的 TensorFlow 使用者 " 叛逃 " 到 PyTorch 阵营。PyTorch 官方 Twitter 的关注者里,谷歌大神 Jeff Dean 也悄悄成了 " 粉丝 "。

图片来源于 The Gradient

行业普遍认为 TensorFlow 在工业届广泛应用,而 PyTorch 在学术圈赫赫有名。根据 Paper with Code 数据的统计,PyTorch 论文比例达到了 60%,TensorFlow 的份额仅剩 11%。

TensorFlow 诞生之时,尚可也是建设团队成员之一。

" 起初,谷歌内部的 AI 团队主要希望面向内部打造一个有通用价值、广而全的一套底层深度学习算法框架。当时,也没有 TPU,GPU 也比较贵,所以开发 TensorFlow 1.0 时,团队就意识到:因为要通用,训练效率必须高,不能吃掉太多的加速资源,保证最终成本经济实用。" 他回忆道,这也是 TensorFlow 推出后就迅速被工业届广泛应用的核心原因。

随着谷歌推出 TPU,并在 2019 年开放后,形成软硬件组合矩阵,这为 TensorFlow 带来了新的竞争力,然而这还不足以令其回到一家独大的巅峰时刻。

"TensorFlow 1.0 版本,模型训练比较费劲,写代码的复杂度会高一点,需要自己提前把整个的网络图写出来,然后再给数据去做内容优化。PyTorch 的代码写起来比较简单,构建图时就可以把数据填进去,类似于写普通的代码去调一个函数一样。"

从应用端的体验上,Voil à ! CTO 苏勇(Steve Su)透露,对于商业化公司来说,TensorFlow 的应用频率更高,但实际运用过程中,操作复杂依旧是 " 老大难 " 问题。对于大多数开发者来说,Meta 没有自己的云服务,也没有在硬件方向做太多工作,主要以纯软件的方式做的,所以更加简单友好。

针对 1.0 版本 "bug" 的修复迭代升级,也是对 PyTorch 的第一次反击,2019 年,TensorFlow 2.0 版本上线。

图 :TensorFlow 2.0

很多人说 2.0 版本的推出是谷歌革了自己的一次命。但 2.0 版本时,却发现 1.0 版的模型代码基本上不能用。此外,在 2.0 版,如果遇到问题搜索解决方案时,出现的也是 1.0 版时的答案,得不到想要的信息。此时,很多使用者就会出走,转向 PyTorch。" 苏勇称。

迎战 PyTorch,TensorFlow 逐渐跌下神坛,谷歌试图重回巅峰。

02 AI 大规模商业化,底层框架也要 " 接地气 "

打不过就加入,JAX 是吸收了 PyTorch 和 TensorFlow 精华的融合产物。

"PyTorch 的人数在上涨,TensorFlow 的使用者在逐渐逃离。所以,谷歌直接将 TensorFlow 两个版本融合,打出了新的名号—— JAX。" 苏勇表示,JAX 是 PyTorch 和 TensorFlow 显著特点的结合体:容易上手,计算效率高。

JAX 主要对于 NumPy 的性能优化做的较多,简单来说性能相比原来的方式提升几十倍以上。"NumPy 本身是对于矩阵运算提升了很多,JAX 基于 NumPy 再提升,这形成一个非常大的优势。"

据悉,JAX 的计算函数 API 则全部基于 NumPy,可以让模型很轻松在 GPU 和 TPU 上运行。简而言之,JAX 计算速度很 " 快 "。

" 因为 PyTorch 易用性高,所以在高校学术届风靡。但是当学术圈和商业界破壁后,学术研究可以商业化后,工程师发现在 PyTorch 上的东西还要在 TensorFlow 上重新写一遍。" 他表示,这个操作上的转移空间也是 JAX 的机会。

据谷歌官方表示:JAX 生态系统开发中,也会考虑确保其与现有 TensorFlow 库的设计尽可能保持一致。这也是由于 TensorFlow 两个版本更新替代时,有过前车之鉴。

不过,随着 AI 从神话落入凡尘,应用的落地以及商业价值是核心。此时,对于底层框架来说,相比于技术之上的比拼,生态层面的竞争显得更为核心。

" 从技术角度看,最终使用者对技术差距的感知会比较弱,反而能感知比较深的是生态,比如:身边有多少好友在用,研究的领域大多数人用的是哪一个,使用过程中反馈的问题能不能及时得到解决,有没有可以寻求帮助的一些渠道。" 苏勇解释道。

就像手机系统,一些人最开始选择微软,但是最后微软的操作系统却悄无声息地淡出人们视野。因为开发者选择操作系统时,开发者不仅考虑上手的难度,还需要考虑做出来以后这个 APP 能不能活下来?

随着进入以商业化、规模化为导向的 AI 阶段,底层框架并非炫技之作,各大科技巨头都在 " 接地气 "。

除了谷歌推出 JAX 外,如国内百度的飞桨平台也在强调,基于飞桨平台,AI 开发和应用门槛不断降低,人人都可以成为智能应用的开发者。据百度 CTO 王海峰公开分享的成绩:飞浆平台已积累了 477 万开发者,创建了 56 万个模型。

图:全球 AI 开源框架 Star 数 4 月、5 月榜 TOP2 ;图片来源于 OSS Insight 数据

得开发者亲睐者,得天下。

科技巨头在底层框架上做主导,拥有较强的话语权,为了保证独立性,国内大厂会基于自己的平台持续去优化,也有一些大厂在研发探索底层框架,但中小企业可以不用做底层研究,直接依附大厂做开发。

" 中小厂一般直接用开源的框架,否则跟不上时代。" 苏勇认为,站在 " 巨人的肩膀上可以看得更高,走得更快 "。

" 对于底层框架的选择,我们希望和商业化形成正循环。" 他解释道,今年 3 月,公司获得了 SOSV 中国加速参与的千万级融资后,商业化需求进一步激发。上层加速规模化的同时,底层框架作为地基是否牢固尤为重要。

" 我们核心的一个场景是面向用户的搜索推荐场景,每秒查询率非常高,对结果的精准度要求也高,所以,工业届成熟应用的底层平台更加适合。"

所以,对于苏勇来说,如果 JAX 能在性能、易用性方面展现优势,相对于 PyTorch,前者或将是一个确定性较高的新方案。" 毕竟我们好多服务是用的是 Google 的,包括他们的云计算和 TPU,整体适配度会高一些。"

来源:媒体

THE END
广告、内容合作请点击这里 寻求合作
免责声明:本文系转载,版权归原作者所有;旨在传递信息,不代表砍柴网的观点和立场。

相关热点

相关推荐

1
3