清华·语言识别研讨会成功召开

3月24日，由清华大学和创新企业联盟联合举办的语言识别技术研讨会在清华FIT楼成功召开。由清华大学语音和语言技术中心副主任王东老师以及汤志远博士主持会议。会议邀请了来自昆山杜克大学电子与计算机工程系的李明老师以及中国社科院语言研究所的唐正大老师和厦门大学信息科学与技术学院的洪青阳老师。

会议上，首先由清华大学语音和语言技术中心王东老师阐述了目前语言识别发展中面临的问题和引入技术驱动的必要性，并着重强调了目前东方多语言语种识别竞赛（OLR）对语种识别技术发展的意义。

会议分享环节精彩纷呈，厦门大学信息科学与技术学院副教授洪青阳以OLR获奖模型为题，逐步拆解其获奖模型的技术关键点;

“社科院”唐正大以世界语言为切入点，追溯其语言的本质，深度讲解各地区的语种之间语言特征的种种不同；

而杜克大学李明教授则详解语音识别和声纹识别在端到端之间的技术实现，同时OLR获奖队伍等代表也在现场进行了深度分享。

其次会议中东方多语言语种识别竞赛OLR的颁奖仪式也是一大亮点，由厦门大学洪青阳团队获得短语音语种识别第一名，而网易语音团队梅开二度获得混淆语言语种识别和开集语种识别的第一。

东方多语音语种识别竞赛(OLR)介绍

“东方语种识别竞赛(OLR Challenge-Oriental Language Recognition Challenge)”是海天瑞声和清华大学联合举办的，面向全世界致力于东方语言研究的开发者，提供一个竞技和角逐的舞台。从2016年成功举办第一届之后，今年的OLR Challenge2017，吸引了来自全球19个国家和地区的30多个队伍报名，从参赛队伍的数量和最终提交结果数量，都比第一届大大提高。

　　和OLR 2016相比，OLR 2017需要识别的语言从7种增加到10种，包括汉语普通话、粤语、日语、韩语、俄语、越南语、印尼语、藏语、维吾尔语、哈萨克语。数据总量从去年的70小时增加到116小时，包括697名发音人，约10万条语音。数据集中的7种语言由海天瑞声公司提供，分别是汉语普通话、粤语、日语、韩语、俄语、越南语、印尼语等。其他3种语言由清华大学、西北民族大学、新疆大学共同承接的国家自然科学基金重点课题“多语言少数民族语音识别”项目(M2ASR)提供。

　　OLR 2017的竞赛设置更加合理，包含1秒识别、3秒识别和整句识别三项识别任务。在短语音识别任务里，系统需仅凭短至1秒的语音，就要能准备识别出其对应的语种，这使得竞赛难度大大增加，但也更符合实际应用场景。清华大学提供了基线系统的构造脚本，使得参赛者可以轻松复现i-vector和深度神经网络两种标准语种识别系统。参赛队伍按综合识别结果和短语音识别结果两个标准进行排名。综合识别结果评价参赛队伍在语种识别上的总体科研实力;短语音识别结果反映参赛队伍在1秒语音这种极度困难任务上的科研攻关能力。

创新企业开放联盟成立

最后在会议的高潮，清华大学语音和语言技术中心副主任王东老师宣布创新企业开放联盟的成立，会中王东老师分析了目前语音市场环境中中小企业的技术难点，大公司技术资源垄断占据着市场大多数的业务，而初创公司体量小，技术储备有限。从而使得大公司越强小公司越弱，导致目前整个语音市场无法形成良好的生态环境。