云知声获三项“国际领先”认证,领跑医疗大模型、端侧AI与数字人等多个赛道

每日快讯
2025
10/31
18:04
分享
评论

2025年10月28日,由中国人工智能学会组织的“多模态数字专家关键技术及产业应用”科技成果鉴定会在北京举行。经专家委员会严格评审,云知声研发的“多模态医疗垂类大模型”“芯上端侧小模型精炼化”和“多模态情智兼备数字人”三项技术成果,均达到“国际领先”水平。

鉴定会现场

本次鉴定会汇聚了人工智能领域的顶尖专家力量,鉴定委员会由中科院自动化所副所长、中国人工智能学会副理事长刘成林担任主任,加拿大工程院外籍院士梅涛担任副主任,联合其他6位领域内权威专家共同组成。专家组通过听取技术报告、观摩成果演示、审阅检测资料,并经过多轮深入质询与论证,最终形成鉴定意见。整个评审过程严谨规范,充分体现了认证的权威性与公信力。

在科技创新领域,“国际领先”“国际先进”“国内领先”“国内先进”四大等级是衡量科技成果技术水平的核心标准。其中,“国际领先”作为最高评价等级,代表该项技术在全球相应领域具备突破性创新,能够填补国际技术空白,且在核心技术指标、实际性能与应用效果上,均显著优于国际同类技术。此次云知声三项技术同时斩获这一顶级认证,不仅是对企业长期技术研发投入与创新能力的高度肯定,更标志着公司在人工智能领域取得重要突破。

多模态医疗垂类大模型

“多模态医疗垂类大模型”基于云知声通用大模型(山海大模型)孵化而成,实现了对医学文本、影像(包括X光片、CT、病理切片等)多源异构信息的深度融合与统一理解生成。该模型依托海量、多源、异构的医学数据(涵盖文献、研究、临床记录及知识库)进行深度预训练,通过精细化数据处理技术自动识别优质图文数据,并运用多模态分析评估图文匹配度,成功构建了包含数亿条高质量图文数据的训练体系。在此基础上,创新性地融合了持续学习机制(增量训练)与知识检索增强(RAG)等先进知识注入范式,利用跨模态语义对齐技术不断完善模型能力。

在实际医疗业务场景中,该模型已具备病历生成、医学报告生成、病历质控及影像报告质控等多项业务落地能力。在肝局灶病变良恶性检测任务中,模型准确率突破90%,为临床鉴别诊断提供了高度可靠的AI支持。同时,该模型在多项权威评测中表现卓越:不仅斩获CCKS2023-PromptCBLUE医疗大模型评测A、B榜双料冠军,在临床执业医师资格考试中更取得523分(满分600分)的优异成绩,大幅超越人类考生平均分(365分)。在2025年5月最新发布的MedBench评测榜单中,云知声山海大模型医疗深度思考版(UniGPT-Med-U1)以综合得分93.1分蝉联冠军,并在医学语言理解与医学安全伦理两个专项评测中分别以122.3分和104.9分的佳绩双双登顶,展现出卓越的技术领先性。

在实际医疗业务场景中,该模型已具备病历生成、医学报告生成、病历质控及影像报告质控等多项业务落地能力。

芯上端侧小模型精炼化

“芯上端侧小模型精炼化”技术聚焦小样本持续学习、低资源快速解码、小参数模型增强与低比特模型量化等关键技术路径,系统性地推进AI模型轻量化与效能优化。该技术使大模型能在端侧芯片上高效稳定运行,在低功耗、低算力的实际工况下,充分满足高准确率与高实时性的推理要求。

面向个性化轻量级交互控制需求,该技术提出多种边缘计算端侧部署优化方法,突破性解决了传统端侧模型效果差、解码速度慢等行业痛点。在保持与大模型相当交互效果的同时,成功将模型资源消耗降低百倍以上,显著提升运行效率。

多模态情智兼备数字人

“多模态情智兼备数字人”由云知声与中国科学技术大学於俊副教授团队联合研发。该技术基于创新的“矛+盾”设计思想,在真实感与人机交互能力上实现重要突破。该技术通过设计全局与局部结合的自我交互注意模块,提出多模态数据对齐与视频无损渲染算法,并构建了语音内容与面部动作特征分离的音视频解耦训练框架。同时,团队建立了兼顾外部表观与内部器官的人体全周三维重建体系,充分融合人类生理特性与统计学习方法,构建出高真实感的合成模型;通过完善音视频同步的发音可视化系统,实现了从语音特征到人体器官参数的精准预测,进而达成人体动作与器官状态的视听觉协同表达与跨模态内容生成。基于解剖学精细的内外透视化三维人体合成技术,有效解决了当前数字人技术中普遍存在的动态表现真实感不足、内外结构割裂及缺乏生理关联等核心难题,最终创造出能说会唱、内容丰富、力度多变、行为自然且情感充沛的高保真数字人。该成果可应用于在线客服、虚拟助手、教育培训等多种场景。

在通用人工智能(AGI)浪潮重塑全球产业格局的背景下,专业级“数字专家”正成为推动各行业生产力跃迁的关键引擎。全球特别是中美产业变革竞争加剧,数字专家将引领各行业的生产力变革,成为中美战略竞争的关键。

作为国内AGI技术产业化的先驱者之一,云知声率先把握战略机遇,打通“技术-场景-数据”闭环,构建专业级大模型及智能体,有效整合专业知识、聚焦关键问题,通过行业知识增强和强化学习,致力于专业级大模型构建,推动生产力变革。

通过打造“通用底座-专业智能体-端侧芯片优化-Atlas基础设施”的四层技术架构——通用大模型覆盖广度,专业智能体攻克深度,端云协同实现规模化,基础设施保障进化效率,从智慧生活、医疗、保险、交通等领域切入,为这些垂直行业打造数字专家,形成AI大模型时代的差异化竞争优势及行业壁垒。

加上之前的“AI语音自由说技术”,截至目前,云知声已经在四项关键技术上获得了“国际领先认证”,全面覆盖语音技术、芯片、医疗大模型、数字人技术四大关键赛道,这些成果既筑牢了底层技术根基,也打通了从技术研发到场景落地的完整闭环,为云知声“打造数字专家,引领产业变革”提供了更加强劲的动力!

未来,云知声将继续深化“技术-场景-数据”闭环,持续推动AGI技术的迭代演进。通过拓展技术上限与应用边界,加速商业化落地进程,致力于将前沿技术创新转化为实际生产力,在持续推动产业智能化升级的同时,为中国在全球人工智能竞争中贡献更多突破性成果。

 
THE END
广告、内容合作请点击这里 寻求合作
免责声明:本文系转载,版权归原作者所有;旨在传递信息,不代表砍柴网的观点和立场。

相关热点

相关推荐

1
3