AISHELL-1增加话者识别recipe

2018-01-23

话者识别指通过语音来确认说话人的身份,是和语音识别处理技术类似的一种识别技术。

话者识别和语音识别是一个问题的两个方面,语音识别问题要归一化取掉说话人的个人特征信息,而获取语音的信息,话者识别则相反,在某种意义上讲是归一化去掉语音信息内容,而提取说话人个人特征信息。

随着计算机网络和各种特征信息的开放,对安全保密的要求越来越高,使得话者识别正在成为一种有吸引力的技术手段。

目前,虽然在话者识别方面已取得了一些进展和成果,但还有许多问题有待于解答和探索。

不过这里马上要告诉研究话者识别的朋友们一个好消息:基于aishell-1的话者识别recipe已经merged了kaldi GitHub!

GitHub地址:https://github.com/kaldi-asr/kaldi/tree/master/egs/aishell/v1



本次开源的话者识别识别脚本是基于kaldi里的sre08修改而已,使用aishell-1里的训练数据来训练i-vector模型,使用aishell-1里的test集合分为注册跟验证两部分,注册的3句是从说话人几百句里随机选择,剩下都是验证语句。最后我们使用plda打分来评价。

本次开源出来的aishell-1的话者识别脚本是基于aishell-1的clean环境去做的,加远场或噪音、DNN的一些实验有兴趣的同学可以研究。

此次speaker recogniton recipe,为大家提供一个话者识别的范例,祝大家学习愉快。





本网站由阿里云提供云计算及安全服务