竞赛简介
目前语音生成技术已经日趋成熟,生成的语音在特定条件下可以与真人语音相媲美,该技术在生活、娱乐、新闻、教育、医疗、金融等众多领域具有广泛的应用前景,但是虚假生成语音对社会危害重大,亟需生成语音鉴别技术。虽然该技术已引起学术界与工业界的广泛关注,但是鉴别模型还存在泛化性不足和鲁棒性差的问题。因此,中国科学院自动化研究所的陶建华研究员联合新加坡国立大学的李海洲教授在语音领域国际顶级会议 ICASSP 2022上举办首届语音深度合成鉴别挑战赛(The First Audio Deep Synthesis Detection Challenge, ADD 2022),希望能激励世界各地的研究人员提出具有创新性的算法,从而推动和促进该领域的技术发展。
参加所有赛道成绩排名前列和做出具有创新性工作的参赛队伍将有机会在ICASSP 2022会议上发表参赛技术方案的论文,共5篇论文收录于会议论文集。
赛道
本次比赛将分成三个赛道
赛道1--低质量虚假语音鉴别(Low-quality Fake Audio Detection,LF)
这个赛道的真实语音和虚假语音包括各种噪声干扰,虚假语音由语音合成或者语音转换技术生成,每个句子全部为假。
赛道2--部分虚假语音鉴别(Partially Fake Audio Detection, PF)
这个赛道的每句虚假语音并不是全部由生成语音构成,每个句子只有一部分是虚假语音,这部分虚假语音可以来自语音合成技术也可来自其他真实语音等。
赛道3--语音攻防对抗(Audio Fake Game,FG)
这个赛道包括2个子赛道:语音生成任务和生成语音检测任务,两个任务是“攻与防”的关系,两个子赛道分开报名。
子赛道3.1-生成任务(Generation, FG-G):该任务的目的是采用一系列生成方法合成能欺骗检测模型的语音。
子赛道3.2-检测任务(Detection, FG-D):该任务的目的是高泛化性地对生成语音进行检测,并具备对采用攻击方法生成的语音具备一定防御能力。
时间安排(AOE时间)
● 2021.11.16 注册开发,训练和开发数据集发布
● 2021.12.01 参考数据集发布
● 2021.12.30 报名日期截止
● 评估数据集发布
● 2021.12.20 赛道3.1 评估开始
● 2021.12.30 赛道3.2 第一轮评估开始
● 2021.12.30 赛道3.2 第二轮评估开始
● 2021.12.30 赛道1和赛道2评估开始
● 评估截止日期
● 2021.12.26 提交截止
● 2021.12.29 第一轮提交截止
● 2022.01.06 第二轮提交截止
● 2022.01.06 提交截止
● 2022.01.13 向参与者发布结果和排名
● 2022.01.20 系统描述文件提交截止
● 2022.01.30 ICASSP 200 SPGC论文提交截止
微信公众号
联系我们
商务合作:bd@aishelldata.com
技术服务:tech@aishelldata.com
联系电话:+86-010-80225006
公司地址:
北京市海淀区西北旺东路10号院东区10号楼新兴产业联盟大厦3层316室
开源数据