SLT2024
口吃事件检测和语音识别挑战赛
Mandarin Stuttering Event Detection and Automatic Speech Recognition Challenge
由StammerTalk、希尔贝壳、西工大音频语音与语言处理研究组、新加坡南洋理工大学、昆山杜克大学、中国科学技术大学、南开大学、WeNet开源社区等单位发起的“口吃事件检测和语音识别挑战赛”(StutteringSpeech Challenge)将作为IEEE Spoken Language Technology Workshop(SLT2024)的旗舰赛事,正式启动。
报名参加此次赛事,您将获得:
1、首个普通话口吃语音数据集;
2、测试口吃事件检测和语音识别的真实技术水平;
3、SLT2024 受邀论文和报告机会;
4、与国际语音学术和产业界深度交流技术前沿的机会。
背景
口吃是一种影响全球约1%人口的言语障碍,其根本原因尚不明确,存在多种假设,如遗传问题、先天因素及大脑结构与功能差异。口吃不仅影响社交功能和心理健康,还会导致言语重复、拖长、阻塞和伴随行为(如身体动作和面部扭曲),使患者感到压力、羞愧和自尊心低落,害怕交谈。大多数患者在儿童时期开始表现口吃行为,平均发病年龄为30个月。约有20%的患者持续到成年,儿童干预治疗的成功率高于成人。早期诊断的重要性不言而喻。
相较于北美或西欧等地,中国大陆的言语治疗实践仍处于起步阶段,没有单独的言语治疗师资格认证,缺乏专业人士导致许多口吃儿童家庭未能及时诊治。机器辅助的自动化口吃诊断可满足部分家庭需求。
成年后的口吃患者恢复完全的几率很低。为了缓解交流障碍和消除社会歧视,相关产品设计需考虑包容性。随着智能家居设备和聊天机器人技术的普及,语音用户界面变得不可或缺。现有自动化语音识别系统虽然能处理流畅语音,但对口吃语音识别依旧具挑战性。
由此,我们提议在SLT2024举办“普通话口吃事件检测与自动语音识别”挑战赛,这将是首个中文此类挑战赛。我们相信这样的挑战能增强研究者的意识,推动更具包容性的语音技术发展。
本次赛事发布的数据是通过70次在线语音聊天会话精心收集而来的,包括对话和语控词朗读两种场景。每个录音会话由两位普通话母语者(均为口吃者)开始约半小时访谈,随后访谈对象被要求朗读一系列事先准备的语控词。该数据集有效时长约50小时,收录了来自72位不同口吃者(2位访谈者和70位受访者)的全面录音集。
StutteringSpeech Challenge Website
赛道
StutteringSpeech Challenge 设立了两个不同的赛道,同时开放相关主题论文投稿。
Task I Stuttering Event Detection:这是一个多标签分类任务。要求参与者开发模型以识别短音频片段中的口吃事件。可能出现的五种口吃事件包括声音延长、声音重复、字符重复、阻塞和插入语。挑战开始时将向参与者提供包含音频片段及其标签的训练开发集以进行模型开发。
Task II Stuttering Automatic Speech Recognition (ASR):该任务的主要目标是推动能够处理口吃语音的ASR系统的发展。参与者必须设计出能够有效将含有口吃事件的语音识别为干净文本(剔除口吃事件标签)的语音转文本系统。将为系统开发提供包含长篇口吃语音及其文本的训练开发集。
Task III Research Paper Track:邀请参与者提交研究论文,应用口吃语音数据集和评估框架于他们的实验设置和分析中。这是一个探索和记录与口吃语音技术相关的创新方法和发现的机会。
有任何问题,可联系:stutteringspeech@aishelldata.com
赛程安排
2024.4.4 报名开始
2024.4.10 发布训练集
2024.4.17 发布开发集和基线系统
2024.5.27 发布任务 I 和任务 II 的测试集音频和排行榜
2024.6.10 测试集排行榜冻结
2024.6.20 提交系统报告
注册
StutteringSpeech赛事对高校、公司和科研机构开放,参赛者可登录赛事官网 (https://stutteringspeech.org/) 进行注册,请按照以下要求注册挑战赛:
-
机构或者公司邮箱注册,个人邮箱如 163.com、qq.com等不可;
-
提供团队名称、隶属机构、参与赛道信息。
主办方将在3个工作日内通过电子邮件通知符合条件的参赛团队,团队必须遵守赛事官网上发布的挑战规则。本次赛事最终解释权归组委会。
组织者
· Rong Gong, StammerTalk, rong.gong@stammertalk.net
· Lei Xie, Professor, Northwestern Polytechnical University (China), lxie@nwpu.edu.cn
· Hui Bu, CEO, AIShell Inc. (China), buhui@aishelldata.com
· Eng Siong Chng, Associate Professor, Nanyang Technological University, Singapore ASESChng@ntu.edu.sg
· Binbin Zhang, Founder, WeNet Open Source Community (China), binbzha@qq.com
· Ming Li, Associate Professor, Duke Kunshan University (China), ming.li369@dukekunshan.edu.cn
· Yong Qin, Professor, College of Computer Science, Nankai University (China), qinyong@nankai.edu.cn
· Jun Du, Associate Professor, University of Science and Technology of China (China), jundu@ustc.edu.cn
· Hongfei Xue, Ph.D Student, Northwestern Polytechnical University (China), hfxue@mail.nwpu.edu.cn
· Jiaming Zhou, Ph.D Student, Nankai University (China), zhoujiaming@mail.nankai.edu.cn
· Xin Xu, AIShell Inc. (China), xuxin@aishelldata.com
微信公众号
联系我们
商务合作:bd@aishelldata.com
技术服务:tech@aishelldata.com
联系电话:+86-010-80225006
公司地址:
北京市海淀区西北旺东路10号院东区10号楼新兴产业联盟大厦3层316室
开源数据