ISCSLP 2022
智能座舱语音识别挑战赛
ICSRC 2022
ISCSLP 2022 Intelligent Cockpit Speech Recognition Challenge
随着汽车逐渐成为人们日常生活中不可或缺的一部分,大家也开始追求更加舒适安全的驾驶环境。传统座舱的人机交互以触控为主,容易分散司机注意力,从而带来风险,于是智能座舱的概念逐渐兴起。
智能座舱的目的是通过支持语音、手势在内的多模态交互,给用户提供一个更加安全舒适的驾驶体验,因此,一个鲁棒的语音识别系统对于智能座舱来说是非常重要的。尽管近年来,语音识别技术取得了很大的发展,但是在智能座舱场景下,仍然存在很多挑战。首先,座舱的声学环境特殊,汽车腔体封闭,而且存在包括媒体广播、风噪、人声在内的各种噪声干扰,其次智能座舱语音识别的内容以指令为主,包括设备控制、导航、多媒体交互等,以短句为主,涉及到大量的命名实体。
当前语音识别领域有大量的开源数据,并且使用开源数据训练的模型在很多任务上都取得了较好的效果,但是这些模型在智能座舱场景下往往会因为特殊的声学环境和语言领域特性而无法取得理想的效果。因此,我们在中文口语语言处理国际会议(The 13th International Symposium on Chinese Spoken Language Processing, ISCSLP 2022)上发起了智能座舱语音识别挑战赛(Intelligent Cockpit Speech Recognition Challenge, ICSRC),在这次竞赛中我们将发布20小时真实智能座舱录制的语音数据,覆盖丰富的驾驶场景,促进智能座舱场景下的语音识别技术的研究与交流。
ISCSLP 2022 将于今年 12月11 - 14日在新加坡举办,会议采用线下和线上相融合的方式,会议上将举办本次竞赛的 Session 和颁奖环节。
赛程安排
- 2022年9月3日 : 发布校验集
- 2022年9月10日: 报名截止
- 2022年9月11日: 发布基线系统和Leaderboard.
- 2022年9月28日 : 发布测试集
- 2022年9月30日 : 提交最终结果截止
- 2022年10月8日 : 公布竞赛结果
- 2022年10月14日 : 优秀队伍邀请论文提交截止
- 2022年10月24日 : 论文最终版提交截止
- 2022年10月14日 : 优秀队伍邀请论文提交截止
- 2022年10月8日 : 公布竞赛结果
- 2022年9月30日 : 提交最终结果截止
- 2022年9月28日 : 发布测试集
- 2022年9月11日: 发布基线系统和Leaderboard.
- 2022年9月10日: 报名截止
- 2022年12月11-14日 : ISCSLP会议与竞赛Session与颁奖
竞赛网址
参赛规则
所有参赛者需要遵守以下比赛规则。
-
允许对原始训练数据进行数据增广,包括但不限于加噪加混响,变速变调,但参赛者只能使用允许的噪声集合 (SLR17,SLR28) 进行增广;
-
任何形式的对测试集的利用都是不允许的,包括但不限于使用测试集微调模型;
-
多系统融合可以用于 track II 但不可以用于 track I;
-
如果两个系统 CER 相同,计算复杂度更低的模型位次更高;
-
训练对齐模型必须使用允许的训练集列表中的数据;
-
语言模型的训练数据只可使用训练集列表中数据的抄本,不能使用额外的文本数据;
-
本比赛最终解释权归主办方所有。
数据发布
竞赛数据共计20小时,在新能源汽车上使用高保真麦克风录制,说话人距离麦克风半米左右。录制场景覆盖音乐播放,窗户开关,驾驶速度等不同情况,说话人性别均衡且无明显口音。语音内容包括:空调指令、通讯指令、多媒体指令、POI 和平衡句。不同类型占比见表1。
Table 1: 数据集不同类型占比情况
本次比赛发布的20小时数据分为校验集和测试集,校验集(包括音频和人工标注抄本)将在比赛开始时发布,测试集音频将在最终评比阶段发布。比赛中,参赛选手可以使用 OpenSLR 开源数据训练模型,其他数据禁止使用。
地址:https://www.openslr.org/index.html
Aishell (SLR33), 178小时安静普通话数据;
Free ST Chinese Mandarin Corpus (SLR38): 102600条电话录制数据;
Primewords Chinese Corpus Set 1 (SLR47):100小时智能手机录制数据;
aidatatang_200zh (SLR62): 200小时600说话人数据;
MAGICDATA Mandarin Chinese Read Speech Corpus (SLR68): 755小时朗读数据;
MAGICDATA Mandarin Chinese Conversational Speech Corpus (SLR123): 180小时对话数据;
MUSAN (SLR17), 噪声数据;
Room Impulse Response and Noise Database (SLR28), 房间冲激响应和噪声数据。
竞赛介绍
报名方式
参赛者需向 azhang@nwpu-aslp.org 发送邮件注册参赛,邮件需符合以下格式:
-
邮件主题: [ ISCSLP 2022 ICSRC Challenge Registration] –队伍名 - 参加赛道;
-
内容需包含队伍名,所属机构,参加赛道,队长和队员的联系方式;
-
报名邮件务必使用学校、研究机构或者公司的官方邮箱发出,公共服务邮箱(例如163com, qq.com, gmail.com)的注册报名不予接受。
我们将在收到邮件的三个工作日内回复确认参赛者的信息。
基线系统
竞赛论文出版
竞赛排名靠前的队伍将受邀提交和方案相关的论文,经过组委会审稿后,依据成绩、方案贡献和论文质量,录用至 ISCSLP 2022 国际会议,收录论文集出版,EI检索,同时在 ISCSLP 2022 会议的竞赛 Session 上宣读论文。
微信公众号
联系我们
商务合作:bd@aishelldata.com
技术服务:tech@aishelldata.com
联系电话:+86-010-80225006
公司地址:
北京市海淀区西北旺东路10号院东区10号楼新兴产业联盟大厦3层316室
开源数据