[发明专利]一种说话人识别方法、装置、存储介质及设备在审

申请号：	202110807643.7	申请日：	2021-07-16
公开（公告）号：	CN113516987A	公开（公告）日：	2021-10-19
发明（设计）人：	田敬广	申请（专利权）人：	科大讯飞股份有限公司
主分类号：	G10L17/02	分类号：	G10L17/02;G10L17/04;G10L17/18;G10L19/26;G10L25/21;G10L25/24
代理公司：	北京集佳知识产权代理有限公司 11227	代理人：	王宝筠
地址：	230088 安徽***	国省代码：	安徽;34
权利要求书：	查看更多	说明书：	查看更多
摘要：
搜索关键词：	一种说话识别方法装置存储介质设备
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【说明书】：

本申请公开了一种说话人识别方法、装置、存储介质及设备，该方法包括：首先获取待识别的目标语音，确定其采样率，提取其第一声学特征；并基于其采样率，对第一声学特征进行处理，得到第二声学特征，然后再将第二声学特征输入至预先构建的说话人识别模型，识别得到目标说话人的目标表征向量；其中，说话人识别模型是利用不同采样率的语音共同训练得到的；接着，可以根据目标表征向量，对目标说话人进行识别，得到目标说话人的识别结果。可见，由于本申请通过将第二声学特征输入至预先构建的说话人识别模型，既保证了输入高频语音声学特征时没有效果损失，又补偿了输入低频语音声学特征引起的效果下降，从而提升了识别结果的准确率。

技术领域

本申请涉及语音处理技术领域，尤其涉及一种说话人识别方法、装置、存储介质及设备。

背景技术

随着人工智能技术的不断突破和各种智能终端设备的日益普及，人机交互在人们日常工作、生活中出现的频率越来越高。语音交互作为下一代人机交互方式，能够为人们的生活带来极大的便利，其中比较重要的是基于语音对说话人进行识别的技术，这被称为说话人识别。例如，说话人识别可应用于对说话人的身份进行确认的场合，如法院审理、远程金融服务、安保、语音检索等领域，均需要基于语音数据对说话人的身份进行准确识别。

传统的说话人识别方法是对宽带和窄带两种不同采样率的语音分别训练和维护说话人识别模型，部署成本较高，且这两种说话人识别模型不能进行相似度匹配，会导致识别结果的准确率较低。

因此，如何使用同一个模型进行识别并提高说话人识别结果的准确率是目前亟待解决的技术问题。

发明内容

本申请实施例的主要目的在于提供一种说话人识别方法、装置、存储介质及设备，能够在进行说话人识别时，有效提高识别结果的准确率。

本申请实施例提供了一种说话人识别方法，包括：

获取待识别的目标语音，并确定所述目标语音的采样率；

从所述目标语音中，提取第一声学特征；并基于所述目标语音的采样率，对所述第一声学特征进行处理，得到第二声学特征；

将所述第二声学特征输入至预先构建的说话人识别模型，识别得到目标说话人的目标表征向量；所述说话人识别模型是利用不同采样率的语音共同训练得到的；

根据所述目标表征向量，对所述目标说话人进行识别，得到所述目标说话人的识别结果。

一种可能的实现方式中，所述说话人识别模型的构建方式如下：

获取第一采样率对应的第一样本语音和教师说话人识别模型；所述教师说话人识别模型是基于第一采样率的语音训练得到的；

获取第二采样率对应的第二样本语音；并从所述第二样本语音中，提取所述第二样本语音的声学特征；所述第一样本语音和所述第二样本语音属于同一样本说话人；