清华系独角兽融资超 25 亿,中美大模型持续“狂飙”

创投圈
2023
10/23
22:23
分享
评论

 

ChatGPT 发布一周年将到来之际,中国、美国的 AI 大模型进展迅速,行业持续 " 狂飙 "。

10 月 20 日,AI 大模型领域独角兽企业 北京智谱华章科技有限公司(以下简称 " 智谱 AI")宣布,已完成新一轮融资,今年以来,智谱 AI 累计融资额超过 25 亿元人民币。

此轮投资方阵容豪华,包括社保基金中关村自主创新基金(君联资本为基金管理人)、美团、蚂蚁、阿里、腾讯、小米、金山、顺为、Boss 直聘、好未来、红杉、高瓴等多家机构,而君联资本等部分老股东跟投,华兴资本担任独家财务顾问。据悉,智谱 AI 创始团队来自清华大学,公司估值据传已超过 100 亿元。

无独有偶。美国 OpenAI 公司于 20 日上线了 DALL-E 3 AI 绘图功能在 ChatGPT Plus 付费版中,而且该公司还公布 DALL-E 3 关键技术论文,用 19 页叙述 " 提示词遵循 " 等技术细节。

事实上尽管美国加码芯片出口管制措施以阻止中国的 AI 发展,但考虑到目前大模型行业的趋势,中国国产算力仍然有望迎难而上。这意味着,中国的 AI 应用产业仍然具有一定的竞争优势,从而在未来全球数字经济变革中承担重要地位。

大模型浪潮下,阿里、腾讯向清华系独角兽投资 25 亿

以 ChatGPT 为代表的生成式 AI,一夜之间火热 " 出圈 ",瞬间掀起了新一波技术浪潮。

美国弗吉尼亚大学经济学教授 Anton Korinek 直言,相比过去 20 年,预计生成式 AI 将在未来 10 年把生产力提高 10%-20%。

事实上,早在 2019 年 6 月,智谱 AI ——这家由清华大学计算机系知识工程实验室的技术成果转化公司,瞄准了当时还未爆火的大模型技术。公司集结了一群清华大牛—— CEO 张鹏毕业于清华计算机系,总裁王绍兰为清华创新领军博士,清华大学计算系教授唐杰也参与研发中国最大规模预训练模型悟道 2.0。

智谱 AI CEO 张鹏

2020 年,智谱 AI 开始了 GLM 预训练架构的研发,并训练了 100 亿参数模型 GLM-10B。2021 年,公司利用 MoE 架构成功训练出万亿稀疏模型,并于 2022 年公布了 1300 亿级超大规模预训练通用模型 GLM-130B,而且还以此打造大模型平台及产品矩阵。

2023 年,智谱 AI 推出千亿基座的对话模型 ChatGLM,并开源单卡版模型 ChatGLM-6B 等,部署于个人开发者和企业应用领域。今年 6 月,智谱 AI 迭代出 ChatGLM2,包括 6B、130B、12B(120 亿参数)、32B、66B 等参数的模型,效果全面提升,推理速度增长 42%。据张鹏透露,相比 GPT-4 版的 ChatGPT,ChatGLM2-12B、32B 和 66B 性能分别提升 16%、36% 和 280%。

当前,智谱 AI 开源模型在全球下载量已超过 1000 万次。同时,公司也进行了商业化探索,打造了 AIGC(生成式 AI)模型及产品矩阵,包括已获批上线的智谱清言、高效率代码模型 CodeGeeX 等。

融资方面,创立至今的四年来,智谱 AI 共完成三轮融资,最近一次消息是 2022 年 9 月公司宣布的 B 轮,投资方包括华控基金、启明创投、君联资本、中科创星、将门创投等机构。

如今,智谱 AI 又完成了一轮 25 亿元融资,阿里、腾讯、小米、蚂蚁等巨头纷纷参与。公司称,上述融资将用于基座大模型的进一步研发,更好地支撑行业生态。

据财新,目前智谱 AI 公司估值已超过 100 亿元。

OpenAI 罕见公布新模型技术

10 月 20 日,OpenAI 向 hatGPT Plus 和 Enterprise 用户上线了最新的 DALL-E 3 文生图模型的访问权限。

据悉,DALL-E 3 于上个月首次发布,相比 DALL-E 2,OpenAI 第三代文生图技术首次内置在 ChatGPT 当中,可允许用户提供更直观的描述性信息从而生成图片,而且新技术生成的图像更逼真,效果更好。OpenAI 表示,其为 DALL-E 3 模型提供安全堆栈技术,从而为扩展功能做好准备。

与此同时,OpenAI 团队还非常罕见的公布了 DALL-E 3 的部分技术细节,因为 ChatGPT、GPT-4 到目前为止都没有全部公布相关技术论文。

此次论文中,OpenAI 详细阐述了 DALL-E 3 的技术改进,首先团队提出了一种改进图像生成系统的方法 " 提示词遵循 ",通过训练高质量的生成图像标题来提高文本生成图像的能力。而且,团队还创建了一个比较庞大、精准的提示词数据,该数据集详细描述了每个图像的内容,包括主要对象、周围环境、背景、图像中的文本、风格、颜色等。

其次,作者使用新的数据集对基础提示词进行微调,生成 " 描述性合成提示词 "。随后,作者利用研发的 " 图像生成器 ",应用于文生图数据集的每个图像,生成关键提示词用于后续实验。

最终,OpenAI 团队使用 95% 的合成提示词和 5% 的真实反馈的数据集训练了 DALL-E 3 模型,并内置在 ChatGPT 应用中,以发挥模型的最大潜力,和实现高精确度的文生图反馈。

此外,团队还让 DALL-E 3 在多个测试中跑分,已显示出较好的性能。在 CLIP 得分评估中,DALL-E 3 明显优于 DALL-E 2 和开源的 Stable Diffusion XL 模型;在 Drawbench 基准评估中,DALL-E 3 同样优于 DALL-E 2 和 Stable Diffusion XL,差距在 20%-30% 左右。

OpenAI 公司 CEO 奥特曼(Sam Altman)此前已表示,新的 DALL · E 3 效果相当惊人。" 如果不尝试的话,很难理解这是多么了不起的事情。"

另据报道,OpenAI 去年开始研发的一款轻量化模型,内部代号为 "Arrakis",现已停止开发,原因主要是大模型的商业化步伐放缓。据市场机构 Appfigures 的数据,ChatGPT 在过去 9 个月的收入增长超过了 30%,但到了 9 月,其增速仅为 20%,显示出增长放缓趋势。

然而,相比于 OpenAI,由于美国不断加码芯片出口管制措施,中国 AI 大模型之路更为严峻,。

10 月 17 日,美国商务部下属工业与安全局(BIS)发布了对中国半导体出口管制最终规则,在去年 10 月 7 日出台的临时规则基础上,进一步加严对 AI 相关芯片、半导体制造设备的对华出口限制,并将多家中国实体增列入出口管制 " 实体清单 "。

这一措施已影响到大模型算力巨头英伟达、英特尔、AMD 等厂商在华产品销售。英伟达已表示,包括 A100/H100、A800/H800、L40s/L40、RTX4090 等产品受出口管制影响。公司创始人黄仁勋直言,这一管制措施将对英伟达在中国市场有很大影响。

Counterpoint 分析师 Brady Wang 表示," 从长远来看,如果美芯片制裁持续下去,这将影响到中国 AI 发展。"

当然,国产大模型算力能力依然也在不断增强。科大讯飞在 10 月 19 日第三季度业绩会上表示,出口管制对将构建在英伟达算力上的大模型厂商产生较大影响,但科大讯飞已于 2023 年初与华为昇腾启动专项攻关,合力打造中国通用人工智能新底座,让国产大模型架构在自主创新的软硬件基础之上。

科大讯飞方面强调,当前华为昇腾 910B 能力已经基本做到可对标英伟达 A100。

10 月 20 日,工信部新闻发言人、总工程师赵志国表示,中国正加快推动算力基础设施建设发展。下一步,工信部持续推进算力发展,加强基础设施建设,构建梯次化算力基础设施体系架构,使多方算力互联互通,促进技术创新和应用融合。

来源:钛媒体

THE END
广告、内容合作请点击这里 寻求合作
免责声明:本文系转载,版权归原作者所有;旨在传递信息,不代表砍柴网的观点和立场。

相关热点

相关推荐

1
3