赛事简介
语音可以作为一种生物识别的形式,通过对说话人语音的采样,我们对说话的身份进行验证,在语音助手、安防等领域有着广泛的应用场景。相对于基于文本内容的说话人识别,文本无关的验证因减少了变化的约束,从而更具挑战性。语音样本可以通过不同的录音设备获取,多种设备带来的比特率不匹配、信道噪声、背景噪声等进一步增加了说话人识别的挑战。
本届大赛语音赛道我们围绕当下备受关注的智能家居、语音助手等应用场景设计赛题,开展说话人识别相关领域的比赛。区域赛中,参赛选手需要设计并训练具有鲁棒性的模型,可以胜任跨设备的文本无关的说话人识别任务。详见赛题说明。
本次大赛语音赛道数据集由希尔贝壳 AISHELL提供。
赛程安排
• 2019年03月08日 启动报名、开放初赛训练集。
• 2019年03月12日 开放训练集和开发集。
• 2019年03月18日 开放开发集提交通道供选手预演提交流程。
• 2019年03月29日 报名截止。
• 2019年04月08日 15:00 开放正式测试集及提交通道。
• 2019年04月11日 15:00 结果提交截止。
• 2019年04月15日 公布区域赛线上成绩及入选线下答辩名单。
• 2019年04月17日 至 2019年05月17日 区域赛答辩,公布总决赛入围名单。
• 2019年05月18日 发布总决赛题目。
• 2019年05月18日 至 2019年06月10日 总决赛线上赛。
• 2019年06月20日 公布总决赛线上成绩及入选线下答辩名单。
• 2019年07月01日 总决赛线下答辩。
• 2019年07月02日 公布大赛名单并颁奖。
赛题说明
决赛赛题
任务目标
为跨设备的语音识别服务设计说话人识别模块。有若干说话人共享使用语音识别服务,每个说话人均通过不同设备使用若干句语音进行注册。这些说话人使用不同的设备访问该服务,要求自动识别出每一句输入来自哪一个说话人。
规则说明
一、训练集
参赛选手可以使用大赛官方提供的训练数据集,也可自选数据集设计并训练模型,以完成说话人身份识别的任务。
训练数据不限,参赛选手可以采用任意开源数据集(须取得合法授权,并可提供给大赛主办方用于结果的复现)。
推荐训练数据:
-
希尔贝壳提供的 AISHELL-2 中文语音数据库。
-
区域赛开发集。
二、开发集与测试集
开发集与测试集结构相同,但说话人数量不同(开发集4人,测试集16人)。开发集仅供参赛选手调试和验证程序,不计入最终成绩。
每个说话人的语音来自三种录音设备:高清麦克风、Android手机和iOS手机,每种设备均有不同距离的录制。
语音包含4字以下的短句,也有4字以上的长句。
部分录音包含环境噪声。
语音数据分为注册数据和测试数据两部分。
a) 注册数据
注册数据中,每人说话人都会使用15句话注册自己的声纹,分别来自三种录音设备的进场录制。
b) 测试数据
测试数据中,包含已注册说话人的若干条语音,其中包含部分短句。
结果提交
预测结果以CSV格式提交,形如:
FileID,SpeakerID ae998e7c5e74ade76c83c884f42ca9bc,1 07767576a9e8b468d38567bf3116396d,3 ... 字段说明:
FileID 文件ID,与测试集中测试文件ID一一对应; SpeakerID 预测的说话人ID。
计分公式
S最终得分,N表示用于测试的语音数,pi表示说话人的预测是否正确,正确为1,错误为0。
结果提交
测试集会于6月7日15:00开放给选手,选手需要在72小时内提交正式数据集的验证结果、模型和代码,详见“结果提交”页面。每队选手有6次提交机会,取最好成绩作为客观成绩。
比赛要求
参赛选手需要同时提交说明文档、预测结果、训练和预测代码、模型(参数集),详见【结果提交要求】。
参赛选手所提交程序应可在Linux环境顺利运行。建议(不强制)使用Python 2.7或Python3.6作为首选编程环境。不限制第三方软件包使用,但须获得合法授权和软件拷贝,以确保主办方可以复现程序运行过程。
参赛选手提交的程序须满足输入输出的要求,参见“结果提交”页面。 参数选手的提交物需要可完整复现训练和预测过程,主办方不会做任何代码修改,如无法复现的,视作无效提交。
参赛选手可以使用公开开源的数据集和预训练模型,但需要取得合法授权并可向主办方提供作为复现参赛结果之用途。
不得将自行手工标注的结果运用于训练和测试。
决赛获奖队伍代码开源
此开源代码为2019年语音赛道决赛获奖队伍的提交代码,仅供选手交流学习。
下载地址:链接: https://pan.baidu.com/s/1XATqV4z8XAlFbSAw5uHd0A 提取码: 9rs7
区域赛赛题
任务目标
设计一个声纹锁,家庭成员可以在特定设备上通过任意3句短句注册身份,仅家庭成员通过说任意短句可以开锁,未注册人员(攻击者)无法通过语音开锁。
规则说明
参赛选手需要基于给定的训练数据集或自选数据集,设计并训练模型,以完成说话人身份识别的任务。
训练数据不限,参赛选手可以采用任意开源数据集(须取得合法授权,并可提供给大赛主办方用于结果的复现)。
推荐训练数据:希尔贝壳提供的 AISHELL-2 中文语音数据库。
测试集中包含若干组说话人,每组说话人中有5位家庭成员,5位攻击者。其中,每个家庭成员都会用3句话注册自己的声纹,每个家庭成员可能来自不同的设备注册(远场麦克风或近场Android手机设备),但每个人只使用一种设备注册。每个组提供5个家庭成员与5个攻击者用于验证的语音,每句话有可能来自任意一种设备。声纹锁需要区分每句话是否来自家庭成员。
数据集详细信息见“数据集”页面。
预测结果以CSV格式提交,形如:
FileID,IsMember
ae998e7c5e74ade76c83c884f42ca9bc,Y
07767576a9e8b468d38567bf3116396d,N
...
|
字段说明:
• FileID 文件ID,与测试集中测试文件ID一一对应;
• IsMember 是否家庭成员,Y为是,N为否。
S最终得分,N表示用于测试的语音数,pi表示家庭成员的预测是否正确,正确为1,错误为0。
数据集发放与结果提交
开发集会先行开放,提供给参赛选手调试程序和验证模型。开发集结果可提交至竞赛平台,获取跑分,但不计入比赛成绩。
测试集会于约定时间开放给选手,选手需要在72小时内提交正式数据集的验证结果、模型和代码,详见“结果提交”页面。每队选手有3次提交机会,取最好成绩作为客观成绩。
比赛要求
• 参赛选手需要同时提交说明文档、预测结果、训练和预测代码、模型(参数集),详见【结果提交要求】。
• 参赛选手所提交程序应可在Linux环境顺利运行。建议(不强制)使用Python 2.7或Python3.6作为首选编程环境。不限制第三方软件包使
用,但须获得合法授权和软件拷贝,以确保主办方可以复现程序运行过程。
• 参赛选手提交的程序须满足输入输出的要求,参见“结果提交”页面。
• 参数选手的提交物需要可完整复现训练和预测过程,主办方不会做任何代码修改,如无法复现的,视作无效提交。
• 参赛选手可以使用公开开源的数据集和预训练模型,但需要取得合法授权并可向主办方提供作为复现参赛结果之用途。
• 不得将自行手工标注的结果运用于训练和测试。
奖项设置
总奖金额 100,000元。
区域赛
获奖说明:各分赛道区域赛阶段,各区域中系统评定分数前五名的队伍进入现场答辩环节,最终在区域赛现场答辩环节中获得各区域内前三名及优秀奖的队伍可获得以下奖励权益:
奖学金及奖品
• 第一名队伍:5000 元 /队;机械键盘1个/队;七月在线3299元VIP会员1个/队;人工智能图书1本/队;贪心学院价值3100元学习礼包;
• 第二名队伍:2000 元 /队;机械键盘1个/队;七月在线1000元课程代金券一张/队;人工智能图书1本/队;贪心学院价值3100元学习礼包;
• 第三名队伍:1000 元 /队;机械键盘1个/队;七月在线1000元课程代金券一张/队;人工智能图书1本/队;贪心学院价值3100元学习礼包;
• 优秀奖队伍:七月在线100元课程代金券一张/队;人工智能图书1本/队;贪心学院价值3100元学习礼包。
奖励/荣誉
• 可参加知名企业大数据及AI专项培训、现场授课、在线直播;
• 免费成为中国计算机学会CCF会员;
• 获得知名企业的就业、实习机会;
• 业内专家、大咖指导和交流;
• 中国青少年发展基金会奖学金荣誉证书。
决赛
获奖说明:决赛阶段,各区域中系统评定分数前三名的队伍晋级决赛,决赛系统评定分数前五名的队伍进入决赛现场答辩环节,最终在决赛现场答辩环节中获得各项目内前三名及优秀奖的队伍可获得以下奖励权益:
奖学金及奖品
• 第一名队伍:50000 元 /队;iPad2018新款1部/队;七月在线3299元VIP会员1个/队;人工智能图书1本/队;贪心学院训练营礼包并直接入选论文社;
• 第二名队伍:20000 元 /队;七月在线1000元课程代金券一张/队;机械键盘1个/队;人工智能图书1本/队;贪心学院训练营礼包并直接入选论文社;
• 第三名队伍:10000元 /队;七月在线1000元课程代金券一张/队;机械键盘1个/队;人工智能图书1本/队;贪心学院训练营礼包并直接入选论文社;
• 优秀奖:七月在线1000元课程代金券一张/队;人工智能图书1本/队;贪心学院训练营礼包并直接入选论文社;
• 此外所有参赛队伍均可获得由贪心学院提供的1550元课程优惠礼包。
奖励/荣誉
• 可参加知名企业大数据及AI专项培训、现场授课、在线直播;
• 免费成为中国计算机学会CCF会员;
• 获得知名企业就业、实习机会;
• 业内专家、大咖指导和交流;
• 中国青少年发展基金会奖学金荣誉证书。
语音决赛测试集结果提交排行榜
名次 | 战队名称 | 得分 | 提交时间 |
1 | 代码是不会骗人的 | 0.992738 | 2019-06-12 |
2 | 张良请战暗影主宰 | 0.976239 | 2019-06-12 |
3 | 橙色葫芦娃 | 0.970320 | 2019-06-12 |
区域赛测试集结果提交排行榜
名次 | 战队名称 | 得分 | 提交时间 |
1 | IIPL | 0.984444 | 2019-04-11 |
2 | niceLi | 0.975556 | 2019-04-11 |
3 | 代码是不会骗人的 | 0.948889 | 2019-04-11 |
微信公众号
联系我们
商务合作:bd@aishelldata.com
技术服务:tech@aishelldata.com
联系电话:+86-010-80225006
公司地址:
北京市海淀区西北旺东路10号院东区10号楼新兴产业联盟大厦3层316室
开源数据