希尔贝壳与西北工业大学-音频语音与语言处理研究组交流会

2018年9月27日,希尔贝壳总经理卜辉先生及其团队骨干与西北工业大学的音频、语音与语言处理研究组的师生进行了深入的技术交流。

西工大的音频、语音与语言处理研究组隶属于陕西省语音与图像信息处理重点实验室,在20多年的发展中,已形成了人机语音交互、语音与音频信号处理、音视频多模态信息处理、情感识别、多媒体内容分析、机器学习等主要科研方向。

此次交流会由实验室负责人谢磊教授围绕语音识别相关场景进行展开。会议开始,谢磊教授首先介绍了实验室的主要情况,并展示了部分技术上取得的成果。


谢磊教授



之后,卜辉先生在计算机学院105报告厅给广大师生带来了题为“场景语音大数据建库和AISHELL-ASR技术研究分享”的报告。


卜辉先生


报告中,卜辉先生首先介绍了希尔贝壳公司成立的初衷,即人工智能民主化。然后就场景语音大数据建库及AISHELL-ASR方面的技术进行了详细的解说。

报告不仅分析了语音市场的需求情况,而且针对语音行业内的痛点,在如何让数据库更优质的服务于技术的问题上,以盲源分离与车载场景为例,详细解说了根据不同的场景定制更优质的数据库,从而提升深度学习精度,精准解决产品需求,让技术呈现出更好的结果。

会议最后,卜辉先生分享了希尔贝壳目前的工作进展。学术方面,在全球最大语音社区kaldi开源了AISHELL-1和AISHELL-2大词汇量语音项目,助力了全球150+所高校在语音技术领域的科研发展;商业方面,希尔贝壳根据不同的场景数据库,定制了相关的语音识别场景模型,用以解决行业内的基本需求。


希尔贝壳团队与谢磊教授合影


附: 谢磊教授简介

·     谢磊,工学博士,教授,博士生导师,西北工业大学计算机学院院长助理,西北工业大学海外引进人才,翱翔青年学者、教育部新世纪优秀人才,陕西省青年科技新星,霍英东青年基础研究基金获得者,IEEE高级会员(Senior Member)。长期从事音频、语音与语言信息处理、多媒体信息处理、机器学习与人机交互技术等领域的研究工作。当前研究兴趣包括:语音识别、语音合成、语音信号处理、语音关键词检出、对话系统与语音交互、三维虚拟声、音视频多模态处理、语音内容分析等。主持和参加多项国家自然科学基金、863计划、教育部新世纪优秀人才支持计划、香港研究资助局项目、国际合作课题、省部级基金课题与科技计划等。

·     谢磊教授担任中国中文信息学会理事、中国中文信息学会语音信息专业委员会副主任,亚太信号与信息处理协会(APSIPA)语音语言与音频学术委员会委员、国际中文口语语言处理兴趣小组(SIG-CSLP) Workgroup Chair、NCMMSC常设机构委员、中国计算机学会多媒体专业委员会委员、中国图形图像学会多媒体专业委员会委员、中国计算机学会高级会员等。



希尔贝壳,以人工智能民主化为目标