AI 机器人的终极形态是什么?给你 2 个选项,看你能否猜准确。
形态一:纯工具。比如某车间里,一台方头方脑的机器人正沿着既定路线巡检。它灵活绕行,扫地,搬东西,巡检 ...
形态二:生物 AI。深夜的医院走廊,一台搭载 AI 系统的护理机器人停在病床前,它没有机械地询问 " 哪里不舒服 ",而是通过患者微表情和语音颤抖识别出焦虑,主动调暗灯光,播放对方喜欢的钢琴曲。
你可能猜对了。" 这种 " 有文化 + 有情感 " 的 AI,可能是机器人的终极形态。" 沸点资本创始合伙人于光东说道,早在 2019 年,公司就押注 AI+ 机器人,从送餐机器人到牙科手术机械臂,投资逻辑始终明确:未来的机器人,必须符合 2 个特征——文化与情感。
于光东将机器人发展路线总结为 3 个阶段:
第一阶段(现在):效率工具。
疫情催生了第一批成功案例:YJKJ 从酒店送餐拓展到写字楼清洁,年收入翻倍;AI 影像诊断公司 SZKJ 靠自动生成报告实现利润。这类项目的共性是替代 " 人力不愿做、做不好 " 的重复劳动,比如分拣、检测、搬运。
第二阶段(进行时):半人化助手。大模型让机器人学会了部分 " 拐弯思考 ",能补充人类已知的知识盲点,甚至部分情感盲点。
第三阶段(5 年内):生物 AI 爆发。
" 文化 + 情感是核心指标。相当于你们身边多了一种生物。以后的 AI 机器人,有可能访谈的比你还好,提的问题比你还尖锐,提的问题比你还温暖,然后甚至还有各种各样的 call back。"
在这个阶段,医疗陪护、文化创作、企业管理是比较好的破局点。
最近,于光东也加入了 Global AI 的投资人阵容,后者是一个面向全球 AI 应用创业者的超早期投资加速平台,旨在推动 " 一人 AI 独角兽 " 时代的到来。
在这篇文章里,他将为我们解读 AI+ 机器人的系统性机会。敬请阅读铅笔道创始人王方与沸点资本创始合伙人于光东的对话。
声明:访谈对象已确认文章信息真实无误,铅笔道愿为其内容做信任背书。
01 过去 7 年 只投 AI+ 机器人
铅笔道:最近几年,投资精力放在哪里?
于光东:2019 年之后,我们就专注于投 AI+ 机器人。今年,我们投的 DRob 机器人引发市场关注,沸点资本是其首轮投资方。
此外,我们还投了 SZKJ,用 AI 分析医疗影像(手持超声,面向基层医院销售)。后来,他们探索出更优的商业模式,通过机器人生成诊断报告,现在仅诊断报告业务就实现年纯收入数亿元。
铅笔道:2019 年就专注 AI+ 机器人,那么早?
于光东:因为我从 03 年开始就涉足互联网,是互联网创业者出身,我在长期实践中发现一个底层规律:任何一个行业,当应用创新显著超过技术迭代时,往往预示着技术即将迎来升级。
2019 年,我们观察到移动互联网应用已无明显红利。例如抖音崛起后,新 APP 的突围难度极大。
投资的互联网创业公司用户量遭遇增长瓶颈,发展面临天花板。这说明什么?这说明产品已触及发展上限。
所以 2019 年,我们就开始研究下一代基础技术该是什么。
当时 OpenAI 的拟人化技术尚未成熟,智能助理功能也不完善,但已具备视觉识别、听觉处理、语言逻辑判断等基础能力 —— 尽管技术形态较为初级,但方向正确。
我们当时研究投资方向时,发现 AI 与机器人必须如同大脑与手脚般协同。最早启发我们的是 YJ 机器人,它证明了 AI 决策 + 机械执行的黄金组合。
无论是机械臂还是移动底盘,本质都是替人类‘行走’于不同场景。基于这个认知,我们干成了件大事:我们与(北航)王田苗教授合作,投资了 MC —— 一家专注于 AI 牙医 + 齿科手术机器人的公司,其核心能力是用 AI 诊断 + 智能制造牙套 + 手术机器人执行种植牙等手术。
这次投资后,我们明确锁定 AI+ 机器人赛道。
铅笔道:这个想法在什么时候尝到了甜头?
于光东:我们从 2019 年启动投资,未曾料到 2019 年年底疫情突然爆发。这疫情三年,对所有项目来说,尤其是此前投资的移动互联网、消费领域的项目造成严重冲击。当时很多基金都受到影响,我们也不例外。我的合伙人在上海,受封城影响长达半年,团队无法当面沟通。
当疫情缓解后,我们重新聚到一起,再回头审视投资的公司时,却发现了意外之喜:我们所有被投企业竟因疫情成为受益者。以我们投资的酒店机器人公司 YJKJ 为例,其借疫情契机实现了快速发展。
铅笔道:具体说说看?
于光东:疫情前机器人使用率较低。疫情期间,外卖配送受限,人员流动管控严格。我们就研究新商业模式,探索仓储配置与酒店电商的融合。同时,写字楼对非接触服务的需求激增,扫地机器人的市场需求显著提升。YJKJ 业务从酒店业务拓展到写字楼,又进入更多场景。疫情对劳动密集型行业的冲击,反而为 AI 机器人创造了发展机遇。
我们投的 AI + 超声机器人公司也是如此。疫情期间,线下就诊受限,医生资源紧张,但肺部感染患者对 B 超检查的需求激增,患者也增加了医护人员风险,远程和全自主扫查的超声机器人需求就出来。
铅笔道:AI 可以与万物结合,你为什么选择 AI+ 机器人公司?AI 纯软件公司你看不看?
于光东:我们为什么强调 "AI 技术 + 机器技术的结合 "?当时 OpenAI 尚未崛起,我们就在思考:单纯的 AI 能否落地成为实际应用吗?
在 2019 年那会儿看来,显然不能。我们当时就判断,必须把 AI 技术和机器人技术结合,通过一个终端载体,才能在各行各业发挥作用。
但这里头有个有趣的点。不同行业对机器人的要求差异显著。就以我们投的骨科机器人项目为例,进行骨盆手术时,传统方式需要四五个 200 斤的壮汉固定患者,否则骨头易受损。这种力量型工作,人力难以实现精准且无创伤的固定。因此骨科手术机器人的手臂必须具备相应力量,这构成了较高的技术门槛。
再比如我们投的牙科公司,制作矫正牙套等精细工作需达到微米级精度,以前只能依赖人工。这就需要机器人有像针一样精细的小手。所以说,机器人技术本身就存在机械壁垒,每个细分领域都有自己的门道。
其次,光有机械还不行,必须得加上 AI 大脑。就说我们投的 YJ 机器人,现在全国这么多台机器人,云端都有统一的 AI 系统在后台支撑。
这就是这个投资方向的由来。
图注:铅笔道作者认为,于光东这张照片像极了世界拳击比赛冠军 - 邹市明
02 机器人进化的 3 个阶段
铅笔道:如果是纯终端但没有 AI 大脑的机器人,你们不会投?
于光东:如果没有 AI 大脑,技术再好也不行。我们见过太多例子,像刷墙、擦玻璃、刷船、泳池清洁、除草的机器人,这些对 " 大脑 " 依赖度低。
以前酒店写字楼门口也放机器人,但只能静态陈列,无法执行外卖配送等任务,为何发展受限?因为其功能局限,既无法处理酒店数据,数据收集也无实际意义。
但我们投的 YJ 机器人不同:配送外卖需具备电梯操作、行人规避等能力,这需要 " 大脑 " 支撑。具备躲避行人、操作电梯的能力后,自然能获取电梯开关次数、客流量等数据,配送后还能掌握门店销售情况。
为何要这样设计?因为通过数据可了解订单量、客流高峰时段的商品销售情况(如牙刷、方便面的购买量)。如此一来,YJ 便成为酒店的 CRM 系统,这正是机器人与 AI 结合的价值所在。
铅笔道:2019 年那时候,人形机器人算是一个行业话题吗?
于光东:并非如此。但技术发展并非一成不变—— 我们研究 AI 这么久,发现它根本不是大家以为的 " 线性递进 "。若技术进步呈可预测的规律,我们早已能精准投资最具潜力的项目,事实并非如此。
技术发展充满突变性,甚至可能出现阶段性倒退后突然突破。如同人形机器人,如今虽被广泛讨论,但其爆发时点难以预判。
AI 技术也是这个逻辑,以当前的大模型为例,谁敢断言这就是终极形态?无人能下此结论。
铅笔道:大模型火了之后,你是否关注它对机器人的影响?
于光东:始终保持关注。为何?因为机器人技术必须配 AI 大脑,而 AI 大脑本质就是大模型。只不过 OpenAI 的进展超出了所有人预期。
我最早是做搜索出身的,以前研究自然语言处理、NLP 这些技术,本来是搜索领域用的。但后来发现,这些技术和大模型的底层逻辑截然不同,属于不同技术路径,并非渐进式发展的结果。
OpenAI 和 ChatGPT 解决的最大问题是 " 拟人化 " —— 或者说,它们学会了人类的思维方式。原来的 AI 是靠数据做直线学习 —— 给它 A,它回 A+;给它 B,它回 B+;给它 C,它回 C+。本质上就是机械对应。但如今的 DeepMind,其思路变成了模拟人类的曲线思维。这才是拟人化的核心。
铅笔道:原来的 AI 喂进草吐出的是草,现在的 AI 喂进的是草,吐出的是奶。大模型与机器人结合后,你认为发展路线是什么?
于光东:大致分为三个阶段。
第一个阶段是纯工具阶段,即当前阶段。机器人的主要作用是提升效率、增加产能、提高利润、降低成本,比如物流机器人、工业机器人等,执行扫地、搬运等标准化作业。
第二个是 " 半人化助手 ",或称为高级智能工具。机器人能补充人类的知识盲区,甚至部分情感盲区 —— 如同现在的豆包所发挥的作用。
第三个阶段是 " 生物 AI"。它的核心是:文化 + 情感沟通——也是我们要重点投资的方向。
它具备两个特征,文化理解与情感交互,
它会变成生物,或者叫生物化 AI,相当于身边多了一种新生物。或者说举个现实的例子,未来的 AI 机器人可能在访谈中表现更优,提出的问题更具深度与温度,甚至能呼应前文话题。
铅笔道:三个阶段到来的时间点是什么时候?
于光东:第一、二阶段已经到来了。第三个阶段,我认为五年之内一定会到来。
铅笔道:第一个阶段的机器人,目前还剩多少问题没解决?
于光东:第一阶段的问题已无需过度考虑时间因素,因为终将解决,只是时间问题。从技术到方法论,我们投资的企业已形成成熟体系,"AI 大脑 + 机器人执行 " 的标准清晰明确。
其应用场景由人类设定,主要针对人力效率低下或难以完成的任务,如分拣、奢侈品检测等。例如,我们投了一家 AI 奢侈品检测公司,用于鉴定真伪。
铅笔道:如果现在出现一个优秀的团队,还在做第一个阶段的机器人,你愿意投吗?
于光东:会综合评估,关注利润率、营收等指标,最终以利润和现金流为导向。具体方向上,我会更关注医疗领域。
铅笔道:第二阶段的机器人什么时候到来?
于光东:第二阶段其实还在发展,本质是与人类需求对齐的过程——如同优秀的心理医生需多次沟通才能挖掘患者内心真实问题。
铅笔道:你现在的主要精力放在哪个阶段?
于光东:目前更多聚焦第二阶段,比如各行各业的 AI 应用。但我觉得真正的 AI 应用爆发是在第三阶段。因为第二阶段,大厂一定会介入。
铅笔道:哪个阶段的独角兽更多些?
于光东:独角兽肯定会有。这个规律跟所有行业一样——从 PC 互联网到移动互联网,每个周期都是这样。最终能成功上市的可能就千分之二。分母是 VC 投过的公司,分子是上市公司。但上市并非终极目标(笑)。
第一阶段应用比较分散,缺乏平台化可能,都分散在各行各业里,因而能躲过巨头竞争。
第二阶段算是过度阶段,因为生态仍是原有体系,硬件还可能是智能手机或者智能眼镜,操作系统也未更新 —— 这些核心资源掌握在巨头手中。
只有当全新技术与硬件终端出现时,才有可能迎来 AI 爆发时代。
03 看好方向:医疗、文化、公司管理
铅笔道:从全世界角度,这三个阶段的机器人,最先进的公司已经走到哪一步了?
于光东:国外已经有公司处于第二阶段向第三阶段过渡的阶段了。
比如内容创作机器人。输入关键词即可基于用户深层思维生成故事。还有三分钟时长的冰岛纪录片,制作成本约 40 美元。实际使用中发现:输入信息越多,成片效果反而越差(笑)。
再比如医疗 + 情绪机器人。
铅笔道:你提到的这些公司,现在属于什么阶段?
于光东:我认为最多到 B 轮吧,A、B 轮融资额已经较高了,达到数亿元规模。
铅笔道:这些类似公司,在国内有吗?
于光东:目前尚未看到。国内受政策、市场环境影响,主要仍在解决第一阶段的问题。
我始终坚持核心观点:不论国内还是国外,终极的机器人一定是生物 AI,未来具有突破性的应用必然与文化、情感相关。。否则 AI 这么拟人化演进意义何在?当年我们一天处理 10 亿数据的时候,数据处理能力就已经足够了——关键是要解决人类大脑的复杂情感需求。
铅笔道:文化 + 情感机器人,你最看好哪些应用?
于光东:比如公司管理。未来具备 AI 管理能力的公司才堪称领先。
深入思考可知,无论经营何种企业,都需要明白一个道理:公司管理最需要文化、情感和执行力这三样东西结合。
效率与成本控制是基本要求,但若单纯追求效率,将员工视为机器,要求其超负荷工作,显然不现实。因此,必须以文化为支撑。
咱们今天探讨一件事儿,当下中国颇具影响力的公司是哪家?字节跳动当之无愧。
我认为其核心竞争力在于 AI 应用,突出体现在用机器管理公司,这已超越所有传统互联网公司。
我曾长期从事互联网行业,实话而言,互联网公司的成败最终并不取决于产品或技术 —— 因为互联网本质是劳动密集型行业,核心在于管理能力。
这道理很简单。当互联网公司做到一定规模,提升效率的首要任务是优化管理流程。例如管理一个日活过亿的 APP,不断有人寻求将内容优先排序,面对宴请、娱乐等诱惑,人力难以完全规避干扰,如何解决?
铅笔道:现在很多企业在用 AI 做 " 数字员工 ",你看好吗?
于光东:个人认为这些做法创新性不足。最值得关注的是字节跳动的 AI 管理模式 —— 即机器管理,本质是通过多维度机器识别实现。若采访直播公司便可知,任意一家领先的直播公司都会认同抖音 AI 管理的精准度。例如主播直播时,抖音可采集至少 50 个维度的数据进行评级。
传统公司如何操作?比如说评 A 级商家时,可能存在送礼拉关系的现象,导致 A 级商家获取资源却无相应产出,C 级商家缺乏流量效率低下,整个体系效率极低。但抖音完全依靠机器管理 —— 是 A 即 A,是 B 即 B,无人能干预。
我个人认为,在公司管理上,字节的高管只能起到 30%~40% 的作用。
铅笔道:文化 + 情感机器人,你还看好哪些应用场景?
于光东:首先是医疗领域。我认为 AI 技术未来肯定会进入医疗和陪护领域。思考一下,以往需要人力解决的问题,如医患关系,仅靠法律或保险能解决吗?显然不能,最终还是要靠富有温度的沟通与关怀。
比如问诊环节,我相信未来必然依赖机器人,这是巨大的痛点。问诊包括生病挂号等一系列流程,简单而言,患者如何描述症状、如何选择科室挂号。
其次是内容 / 文化机器人。比如,国外有家视频 AIGC 公司,把这套生成工具出售给大企业。
来源:铅笔道