清华系独角兽融资超 25 亿，中美大模型持续“狂飙”

创投圈

2023

10/23

22:23

ChatGPT 发布一周年将到来之际，中国、美国的 AI 大模型进展迅速，行业持续 " 狂飙 "。

10 月 20 日，AI 大模型领域独角兽企业北京智谱华章科技有限公司（以下简称 " 智谱 AI"）宣布，已完成新一轮融资，今年以来，智谱 AI 累计融资额超过 25 亿元人民币。

此轮投资方阵容豪华，包括社保基金中关村自主创新基金（君联资本为基金管理人）、美团、蚂蚁、阿里、腾讯、小米、金山、顺为、Boss 直聘、好未来、红杉、高瓴等多家机构，而君联资本等部分老股东跟投，华兴资本担任独家财务顾问。据悉，智谱 AI 创始团队来自清华大学，公司估值据传已超过 100 亿元。

无独有偶。美国 OpenAI 公司于 20 日上线了 DALL-E 3 AI 绘图功能在 ChatGPT Plus 付费版中，而且该公司还公布 DALL-E 3 关键技术论文，用 19 页叙述 " 提示词遵循 " 等技术细节。

事实上尽管美国加码芯片出口管制措施以阻止中国的 AI 发展，但考虑到目前大模型行业的趋势，中国国产算力仍然有望迎难而上。这意味着，中国的 AI 应用产业仍然具有一定的竞争优势，从而在未来全球数字经济变革中承担重要地位。

大模型浪潮下，阿里、腾讯向清华系独角兽投资 25 亿

以 ChatGPT 为代表的生成式 AI，一夜之间火热 " 出圈 "，瞬间掀起了新一波技术浪潮。

美国弗吉尼亚大学经济学教授 Anton Korinek 直言，相比过去 20 年，预计生成式 AI 将在未来 10 年把生产力提高 10%-20%。

事实上，早在 2019 年 6 月，智谱 AI ——这家由清华大学计算机系知识工程实验室的技术成果转化公司，瞄准了当时还未爆火的大模型技术。公司集结了一群清华大牛—— CEO 张鹏毕业于清华计算机系，总裁王绍兰为清华创新领军博士，清华大学计算系教授唐杰也参与研发中国最大规模预训练模型悟道 2.0。

智谱 AI CEO 张鹏

2020 年，智谱 AI 开始了 GLM 预训练架构的研发，并训练了 100 亿参数模型 GLM-10B。2021 年，公司利用 MoE 架构成功训练出万亿稀疏模型，并于 2022 年公布了 1300 亿级超大规模预训练通用模型 GLM-130B，而且还以此打造大模型平台及产品矩阵。

2023 年，智谱 AI 推出千亿基座的对话模型 ChatGLM，并开源单卡版模型 ChatGLM-6B 等，部署于个人开发者和企业应用领域。今年 6 月，智谱 AI 迭代出 ChatGLM2，包括 6B、130B、12B（120 亿参数）、32B、66B 等参数的模型，效果全面提升，推理速度增长 42%。据张鹏透露，相比 GPT-4 版的 ChatGPT，ChatGLM2-12B、32B 和 66B 性能分别提升 16%、36% 和 280%。

当前，智谱 AI 开源模型在全球下载量已超过 1000 万次。同时，公司也进行了商业化探索，打造了 AIGC（生成式 AI）模型及产品矩阵，包括已获批上线的智谱清言、高效率代码模型 CodeGeeX 等。

融资方面，创立至今的四年来，智谱 AI 共完成三轮融资，最近一次消息是 2022 年 9 月公司宣布的 B 轮，投资方包括华控基金、启明创投、君联资本、中科创星、将门创投等机构。

如今，智谱 AI 又完成了一轮 25 亿元融资，阿里、腾讯、小米、蚂蚁等巨头纷纷参与。公司称，上述融资将用于基座大模型的进一步研发，更好地支撑行业生态。

据财新，目前智谱 AI 公司估值已超过 100 亿元。

OpenAI 罕见公布新模型技术

10 月 20 日，OpenAI 向 hatGPT Plus 和 Enterprise 用户上线了最新的 DALL-E 3 文生图模型的访问权限。

据悉，DALL-E 3 于上个月首次发布，相比 DALL-E 2，OpenAI 第三代文生图技术首次内置在 ChatGPT 当中，可允许用户提供更直观的描述性信息从而生成图片，而且新技术生成的图像更逼真，效果更好。OpenAI 表示，其为 DALL-E 3 模型提供安全堆栈技术，从而为扩展功能做好准备。

与此同时，OpenAI 团队还非常罕见的公布了 DALL-E 3 的部分技术细节，因为 ChatGPT、GPT-4 到目前为止都没有全部公布相关技术论文。

此次论文中，OpenAI 详细阐述了 DALL-E 3 的技术改进，首先团队提出了一种改进图像生成系统的方法 " 提示词遵循 "，通过训练高质量的生成图像标题来提高文本生成图像的能力。而且，团队还创建了一个比较庞大、精准的提示词数据，该数据集详细描述了每个图像的内容，包括主要对象、周围环境、背景、图像中的文本、风格、颜色等。

其次，作者使用新的数据集对基础提示词进行微调，生成 " 描述性合成提示词 "。随后，作者利用研发的 " 图像生成器 "，应用于文生图数据集的每个图像，生成关键提示词用于后续实验。

最终，OpenAI 团队使用 95% 的合成提示词和 5% 的真实反馈的数据集训练了 DALL-E 3 模型，并内置在 ChatGPT 应用中，以发挥模型的最大潜力，和实现高精确度的文生图反馈。

此外，团队还让 DALL-E 3 在多个测试中跑分，已显示出较好的性能。在 CLIP 得分评估中，DALL-E 3 明显优于 DALL-E 2 和开源的 Stable Diffusion XL 模型；在 Drawbench 基准评估中，DALL-E 3 同样优于 DALL-E 2 和 Stable Diffusion XL，差距在 20%-30% 左右。

OpenAI 公司 CEO 奥特曼（Sam Altman）此前已表示，新的 DALL · E 3 效果相当惊人。" 如果不尝试的话，很难理解这是多么了不起的事情。"

另据报道，OpenAI 去年开始研发的一款轻量化模型，内部代号为 "Arrakis"，现已停止开发，原因主要是大模型的商业化步伐放缓。据市场机构 Appfigures 的数据，ChatGPT 在过去 9 个月的收入增长超过了 30%，但到了 9 月，其增速仅为 20%，显示出增长放缓趋势。

然而，相比于 OpenAI，由于美国不断加码芯片出口管制措施，中国 AI 大模型之路更为严峻，。

10 月 17 日，美国商务部下属工业与安全局（BIS）发布了对中国半导体出口管制最终规则，在去年 10 月 7 日出台的临时规则基础上，进一步加严对 AI 相关芯片、半导体制造设备的对华出口限制，并将多家中国实体增列入出口管制 " 实体清单 "。

这一措施已影响到大模型算力巨头英伟达、英特尔、AMD 等厂商在华产品销售。英伟达已表示，包括 A100/H100、A800/H800、L40s/L40、RTX4090 等产品受出口管制影响。公司创始人黄仁勋直言，这一管制措施将对英伟达在中国市场有很大影响。

Counterpoint 分析师 Brady Wang 表示，" 从长远来看，如果美芯片制裁持续下去，这将影响到中国 AI 发展。"

当然，国产大模型算力能力依然也在不断增强。科大讯飞在 10 月 19 日第三季度业绩会上表示，出口管制对将构建在英伟达算力上的大模型厂商产生较大影响，但科大讯飞已于 2023 年初与华为昇腾启动专项攻关，合力打造中国通用人工智能新底座，让国产大模型架构在自主创新的软硬件基础之上。

科大讯飞方面强调，当前华为昇腾 910B 能力已经基本做到可对标英伟达 A100。

10 月 20 日，工信部新闻发言人、总工程师赵志国表示，中国正加快推动算力基础设施建设发展。下一步，工信部持续推进算力发展，加强基础设施建设，构建梯次化算力基础设施体系架构，使多方算力互联互通，促进技术创新和应用融合。

来源：钛媒体

THE END

广告、内容合作请点击这里寻求合作

免责声明：本文系转载，版权归原作者所有；旨在传递信息，不代表砍柴网的观点和立场。

清华系独角兽融资超 25 亿，中美大模型持续“狂飙”

相关热点

最新文章

相关推荐

“特斯拉又割了我 7 万块”

用 eSIM 取代手机卡，究竟难在哪里？

这就是 iPhone 13 的“杀手级新功能”？网友：炒华为冷饭！

谷歌Pixel 6真机曝光：最美安卓屏幕没跑了！

iPhone 13机模曝光：值得等！

苹果计划在美国生产 Apple Car 汽车电池

关注我们