ICASSP 2022 |快手联合发起的深度3D音频信号处理挑战赛成绩正式发布

每日快讯
2022
01/28
16:49
砍柴网
分享
评论

近日,由快手音视频技术部联合意大利罗马第一大学(Sapienza University of Rome, Italy),在国际音频顶级会议 ICASSP 2022 上发起的深度3D音频信号处理挑战赛(L3DAS22:Machine Learning for 3D Audio Signal Processing)成绩正式发布。此次比赛共有来自全球近50支学术界和工业界团队报名,比赛成果将在今年5月 ICASSP 2022 大会的 Special Session 上进行分享。

作为第一届L3DAS21比赛的冠军,快手音视频技术部音频算法团队在深度学习的音频信号处理方向上持续探索。此次团队联合意大利罗马第一大学发起挑战赛,旨在提供一个通用的数据集和公平的测试平台,促进真实场景下3D深度音频信号处理核心技术的研究。基于深度学习的3D音频信号处理技术引起学术界和工业界广泛关注,在虚拟和真实会议、游戏开发、音乐制作,自动驾驶及监控等领域深入应用。相较于单通道音频,3D音频携带的增量三维声源方位信息,有助于提升语音和情感识别、声源分离、语音增强和去噪,以及声学回声消除算法的效果。

本次挑战赛共设置了两个任务:

任务一:多通道3D语音增强任务,专注于办公场景下的实时语音增强需求。

任务二:真实场景下特定声源检测和定位任务,专注于自动驾驶、监控等应用场景。

经过近三个月的激烈角逐,挑战赛结果正式出炉。任务一中,卡耐基梅隆大学、百度和腾讯分列前三名;中科院声学所、重庆邮电大学和新加坡ForteMedia分列任务二的前三名。同时,快手将为每个任务的前两名团队提供丰厚奖金。此次挑战赛数据集模拟了40,000余个3D环境,提供了2组 Ambisonics 格式的3D录音。参赛团队的成绩通过语音可懂度指标(Short-Time Objective Intelligibility, STOI)和单词错误率(Word Error Rate, WER)两个指标进行综合评定。

图1:任务一: 语音增强比赛成绩

图2:任务二:声源检测及定位比赛成绩

快手音视频技术部汇聚了音频领域顶尖人才,结合快手业务推进了前沿算法的应用和落地,深入实时语音通信、音频音效及后处理、音频内容理解、音频编解码、音频硬件等多个领域。团队成员在IEEE ICASSP、Interspeech、ACM/IEEE TALSP等顶级学术会议和期刊上,均有发表系列学术论文,并多次斩获音频挑战赛冠军。

快手定义的“音视频”不局限于画面观感,更强调“视”“听”统一的极致体验。在不同场景中,快手音视频技术部通过将丰富的音频处理能力与视频处理能力相结合,自动形成算法决策,为用户呈现真正的视听盛宴。对于前沿技术,团队将持续投入研发与探索,保持领先,以应对更为丰富多元的应用场景。

比赛官网:https://www.l3das.com/icassp2022/results.html

THE END
广告、内容合作请点击这里 寻求合作
快手
免责声明:本文系转载,版权归原作者所有;旨在传递信息,不代表砍柴网的观点和立场。

相关热点

万众期待的北京2022冬奥会正式进入最后10天倒计时。 各类冰雪项目比赛运动员进入最后的准备阶段,作为北京2022冬季奥运会官方转播商,全球首家参与冬奥转播的短视频、直播平台之一,快手早已进入“冬奥时...
每日快讯
新春将至,虎虎生威,快手新春活动再一次火热来袭。目前,快手APP已换上“新皮肤”,分22亿的新标识分外亮眼。据悉,今年快手春节活动分为春节主会场和除夕会场,用户可在1月19日起,通过参与各种趣味活动...
每日快讯
12月27日消息,快手与美团宣布达成互联互通战略合作。
业界
近日,短视频第一股快手宣布与世界斯诺克新媒体版权方北京瑞盖文化传媒有限公司达成版权内容合作,这也是国内短视频平台首次入局该项目的版权。
业界
2月5日,随着6位快手用户在北京快手总部敲响开市锣,中国短视频第一股快手正式于香港联交所主板上市,股票代码为1024。
每日快讯

相关推荐

1
3