历史转折中的百度

2023

10/23

22:12

大风始于青萍之末，命运的偶然和必然经常会纵横交织在一起。

2019 年，是整个人工智能历史上，最为晦暗的一年。继 2016 年 AlphaGo 打败李世石，2017 年 Tansformer 架构横空出世使得技术大规模爆发，2018 年的创业热潮之后。2019 年，资本退潮、技术瓶颈期、场景难落地，开启了人工智能史上的 " 乱纪元 "。

没有人知道通用人工智能何时到来，就像三体人不知道太阳会在何时升起。

那一年，大批 AI 公司陷入裁员风波、资金链断裂、产品难产，能坚持至今的，所剩寥寥。

但也正是在 2019 年，AI 新的希望开始孕育：OpenAI 在 7 月接受了微软的投资并与其深度合作，如今让世人震惊的 GPT-3 正是从那一年开始研发；国内最早树立 AI 战略的百度，从年初就开始进行了一次长达半年的人事调整，如今看来，重新排兵布阵，似乎是开启了长达 4 年的坚守期。

2019 年，王海峰晋升为集团 CTO，继续担任 AI 技术平台体系（AIG）和基础技术体系（TG）总负责人，两者是百度最重要的技术底座；沈抖晋升为高级副总裁，全面负责移动生态事业群，随后在 2022 年又调任至百度智能云，成为百度第二增长曲线的开拓者；而在 2019 年引进的一批新生力量中，何俊杰是唯一一名 80 后百度副总裁，先是负责投资并购和战略投资，后又被重用，负责沈抖空缺出来的移动生态事业群，实权更加在握。

时间来到了 2023 年，Transformer 的能力在这一年终于由 OpenAI 打破了天花板，进阶到一个新的层次，技术的突破让 OpenAI 一举成为全世界最受瞩目的公司。微软盖过了谷歌的科技光辉。

在过去四年里，百度的核心业务形成了由沈抖领军智能云，何俊杰负责移动生态，王海峰压阵技术的三角结构，百度也终于结束了静默期，开始转守为攻，动作不断。

" 重新把每个应用都做一遍 "，是经历了半年蓄力后的第一次亮剑，如今的百度像一颗行星，即将遇到巨大的 " 技术引力场 "，而彻底改变轨道。

大模型涌现前夜

2017 年，谷歌在一篇名为《Attention Is All You Need》的论文中，提出了 Transformer 架构，以替代传统的 RNN 和 CNN 循环模型，论文中展示了 Transformer 的训练准确性高于之前所有模型，训练时间明显低于之前的模型，在训练集内容较少时训练效果也很好。

这之后，Transformer 架构迅速被接受并应用在了 NLP 和 CV 领域，尤其在 NLP 领域，注意力机制让机器能够更准确地理解语义并生成，以及减少信息重复。

作为最早一批发现并跟进 Transformer 技术路线的公司，百度已经在 NLP 领域研究超过十年之久，并已经组成了一支由王海峰、吴甜、吴华等顶尖专家组建起来的精悍的 NLP 队伍。

彼时，NLP 团队成立的第一个重要任务，是打造百度翻译。王海峰将深度学习和神经网络大胆应用在翻译中，加强机器对上下文的理解，形成更流畅的译文。这一勇敢尝试也让百度翻译成为第一个支持 200 多种语种的翻译系统，甚至比 Google 还早了一年零 3 个月。

这也是大模型四大核心能力 " 理解、生成、逻辑、记忆 " 中，理解能力的雏形。

但王海峰觉得，NLP 还不够。他专门跑到李彦宏办公室去做汇报，提出了下个 " 登陆的诺曼底 " ——语音识别。他的理由是，语音识别技术马上要到产业化的临界点，一旦突破很快就会大规模商用。

李彦宏凭借着自己对技术的判断，决定再次支持王海峰，陆续建立了与 NLP 部门平行的 " 语音识别部门 "、" 图像识别部门 " 和 " 知识图谱部门 "。

王海峰的一通操作让很多百度的同学不解，" 这些技术和百度现在的产品也没关系啊，一股脑创建这么多部门，是攒着过年么？"

彼时的王海峰，正是看到了搜索数据对于大模型形成逻辑有着非常强大的支撑。 " 百度有世界上最大的搜索引擎，搜索引擎不仅信息时效性很强，也有很高的准确率，可以构建最全的知识图谱 "，王海峰曾在公开采访中解释道。

在打造文心一言之前，百度沉淀了拥有超过 50 亿实体、550 亿事实的多元异构超大规模的知识图谱，能够通过语言、听觉、视觉等获得对世界的统一认知。其在 2021 年发布的知识增强大模型—— ERNIE ( 文心 ) 3.0，正是文心一言的前身，该项目由吴甜主要负责。

又是 2019 年，百度文心 1.0 发布，在 4 年时间里迭代了 3 个版本。2022 年 11 月，吴甜在公开峰会中同时公布了文心已经累计的 11 个行业大模型，涵盖电力、燃气、金融、航天等领域，产业生态初步形成。

这些，都为百度抢先发布文心一言做了伏笔和铺垫。3 月 16 日，文心一言发布之后，百度再次回到镁光灯下，但比肯定更多的，是质疑。

" 市场需求这么旺盛情况下，谁先做出来还是意义非常大的 "，李彦宏曾在采访里讲到，即便产品并未完全成熟，但仍然要发布的原因：" 文心一言发布之后，无数的人，过去不怎么联系或者行业跟我隔得很远的人都在问，我们怎么能跟百度合作，怎么尽早试用 "。

从技术的角度，大模型更是 " 越用越灵 " 的高速迭代。 " 内测的时候，员工问，文心一言怎么藏头诗写不好？我说等等吧，明后天估计就能学会了，结果第二天果然就能用了，大模型的进步也是一个不断学习的过程 "，王海峰笑道。

在半年时间里，文心一言从 3.0 到 3.5，再到 4.0 版本进行了三次迭代，据王海峰在会上介绍，文心一言用户规模已经达到 4500 万，开发者 5.4 万、场景 4300 个、应用 825 个、插件超过 500 个。

在 NLP 浇的水，施的肥，终于在 2023 年迎来了丰收，也正如李彦宏所讲，技术发展的路径，是 " 一生二、二生三、三生万物 " 的过程。

大模型背后的内功

通用人工智能爆发之后，云计算的关注度和企业重视程度到了顶峰，也随即来到了 "iPhone 时刻 "。

大模型的出现，产生了巨大的算力缺口，云计算既为大模型提供云算力支撑，又是大模型落地企业的最佳着落点，无论是百度还是任何一家拥有大模型的企业，当大模型面世，下一步的重点便是推向市场，让企业用起来。

对于百度而言，这样的重担，落在了沈抖肩上。

在百度的六大事业群负责人中，除了 CTO 王海峰，沈抖是唯一一个高级副总裁。虽然同为技术出身，但和王海峰的 " 工程师 " 角色不同，沈抖从加入百度开始，就一直在负责关键业务的增长。

加入百度的 10 年里，沈抖先后整合了广告投放系统，提高了系统变现能力；将搜索和 feed 信息流进行结合；整合了由搜索升级后的移动生态事业群，补齐了百度移动生态的版图。

如果说，王海峰打造了一把尖刀，那沈抖则是能利用这把尖刀，开拓疆土的先锋官，用李彦宏的话说是 " 敢打硬仗、能打胜仗 "。

2022 年 5 月，沈抖轮岗为百度智能云（ACG）事业群总裁。于百度而言，最开始并没有全力押注云计算，但也正是随着人工智能技术的不断发展，让百度意识到了云计算短板后，开始暗自发力，默默培养第二增长曲线。

由于没有先发优势，百度云过去 10 年的目标都十分明确，不和 " 老炮 " 们比拼 IaaS 层的规模化，而是通过 PaaS＋SaaS 与智能化能力的结合，打出差异化，并以小搏大地切入企业数字化。

2023 百度世界大会上中，沈抖再次提出 " 云智一体 " 战略：" 人工智能与云计算的深度结合是企业快速落地 AI 原生应用的关键。目前，百度集团所有应用和服务全部基于‘云智一体’技术架构运行在百度智能云上 "。

据光锥智能观察，云智一体战略的核心在于，一方面，以百度智能云为依托，可以快速为企业提供整套的大模型服务；另一方面，大模型也推动着企业数字化的门槛变得更低。

在接手 ACG 后的 5 个月里，沈抖针对企业在大模型时代的核心需求，迅速整合出了 " 大模型服务超级工厂 " ——文心千帆，并按需求将用户分为五大类用户。

首先，针对算力资源所产生的需求缺口， 千帆平台提供各类异构算力。比如在耗费最多训练环节，通过分布式并行训练和微秒级互联能力，千帆平台可以实现万卡集群训练加速比达到 95%，有效训练时间占比达到 96%，大幅降低客户算力和时间成本。

其次在模型层面， 对于希望直接调用已有大模型的客户，企业可快速调用包括文心一言在内的多个大模型，同时千帆平台提供中文增强、性能增强、上下文增强等工具。据沈抖透露，目前千帆平台已经服务超过 1 万 7 千家客户。

针对有二次开发需求的客户， 千帆平台为大模型提供再训练、微调、评估和部署等全生命周期工具链，业界最多的 41 个高质量行业数据集，并针对自身业务场景快速优化。

大会现场还进行了如何基于检索增强生成（RAG，Retrieval Augmented Generation）框架，为三一重工快速开发知识问答应用的实操演示：只需在千帆 AI 原生应用工作台中选择预置的 RAG 框架，进行相应的参数配置等工作，就可以快速实现三一重工官网智能客服应用的开发与上线。

沈抖表示，搭建这样一个 " 小助手 "，即使需要处理几千篇万字长文档，成本也只需几百块钱；而之后用户每次咨询，成本仅需几分钱。

一直以来，大型工业、制造业、农业都是数字化的深水区，核心原因就在于产业的复杂性导致了数字化的门槛高，难以落地。

但通过大模型，既降低了使用门槛，也降低了使用成本。不需要打造任何新系统，也不需要人工参与，是技术组件的一个更高级的应用方式， 二者结合，也转起了云智一体的飞轮，逐步蓄力。

大模型的创新挑战

过去已成定局，未来却可以改变。

所有拥有了大模型的厂商，都发现了应用层的机会。微软在 3 月份就开始动刀包括 Bing、Office、Windows 系统在内的全线产品，阿里张勇讲道：" 要用大模型把所有产品重做一遍 "，然而这句话，说起来简单，做起来却是大模型时代最大的创新挑战。

AI 如何重构应用？这不仅要业务能力，更需要想象力，面对一个新的 AI 时代，百度也将指挥棒交到了年轻人手里。

2022 年 5 月之后，接替沈抖作为 MEG 事业群负责人的，是百度人才梯队建设计划中引入的 80 后副总裁——何俊杰。如果说沈抖是 " 硬战派 "，那何俊杰就是名副其实的 " 少壮派 "。正如任正非所说，要 " 让听到炮声的人指挥战斗 "。

重构应用，是不破不立，对比来看，百度对自己，确实 " 下手特别狠 "。

百度世界大会，围绕 " 生态 "，何俊杰交出了 " 移动生态 "、" 内容生态 " 和 " 商业生态 " 的答卷。

其中，移动生态涵盖了 " 新搜索 "、" 新文库 "、文心一言 APP、百度电商 " 慧播星 " 等 AI 原生应用；内容生态层面，通过百度 APP"AI 编辑器 " 等一系列应用为创作者生态赋能；商业生态层面，推出 AI Native 营销平台 " 轻舸 "。此外，何俊杰还公布了文心一言插件生态—— " 灵境矩阵 "，现已全面开放。

百度所定义的新搜索，正是延续了 2010 年李彦宏提出的框计算的逻辑。 具备极致满足、推荐激发和多轮交互三个特点。即用户搜索问题时，" 不再给你一堆链接 "，而是通过对内容的理解，生成文字、图片、动态图表等多模态答案；推荐激发则可以实时推荐用户关心的问题；在针对复杂需求时，多轮交互可以通过提示、调整等方式，满足用户个性化的搜索需求。

需求到匹配的过程，也称之为 " 端到端 " 搜索，但这会打破百度曾经赖以生存的竞价排名模式，广告收入也是一直以来百度最大的现金牛，自己革自己的命并不简单，百度后面还有一场硬仗要打。

AIGC 的能力让一部分百度老应用有了新的活力，比如百度文档从内容检索工具升级为了内容生产工具、百度编辑器成为了内容生成工具；另一部分也探索了新的场景，比如百度轻舸通过 AIGC 一站式生成营销内容并智能投放，结合数字人生成平台 " 慧播星 " 帮助商家扩大营销范围和场景。

同时，随着大模型应用的逐步落地，百度也意识到凭借一己之力终究有限，无限的是合纵而连横。

这正是灵境矩阵的价值所在，这一平台大大降低了大模型插件开发的成本，让有创意、有想法的普通人，也能成为插件开发者。李彦宏表示，插件是一种特殊的 AI 原生应用，也是门槛最低，最容易上手的 AI 原生应用。

插件的特点在于 " 万能接口 "，既可以连接搜索、小程序、内容平台也可以连接任何入口，这样 " 即插即用 " 的使用方式，能让开发者、创作者快速加入到生态中。

何俊杰透露，上线一个月，灵境矩阵已经收到 2.7 万个开发者注册申请，覆盖了 20 多个垂直领域，其中包括企业、机构和个人开发者。

一位百度内部人士告诉光锥智能：" 应用层的大模型插件以灵境为主要平台，会放在文心一言和百度 App 中。千帆更偏底层调用，灵境更偏上层，甚至未来有可能在应用插件层面会替代千帆 "。

结语

2016 年，李彦宏曾说，百度离破产只有 30 天。" 恐龙脚上踩到一个瓢，几个小时以后他的脑子才能反应过来。所以不管恐龙长到多大，都会灭绝 "。

百度不想做恐龙，在意识层面，总是想着十步以外。

幸运的是，百度等到了新时代，度过了最艰难的时刻；不幸的是，在这个新时代的开端，任何费劲心力的抢跑，都会在漫长的竞争下显得微不足道。

但拿到了新的船票，至少是一个新的开始。

来源：光锥智能

THE END

广告、内容合作请点击这里寻求合作

免责声明：本文系转载，版权归原作者所有；旨在传递信息，不代表砍柴网的观点和立场。

历史转折中的百度

相关热点

最新文章

相关推荐

“特斯拉又割了我 7 万块”

用 eSIM 取代手机卡，究竟难在哪里？

这就是 iPhone 13 的“杀手级新功能”？网友：炒华为冷饭！

谷歌Pixel 6真机曝光：最美安卓屏幕没跑了！

iPhone 13机模曝光：值得等！

苹果计划在美国生产 Apple Car 汽车电池

关注我们