[发明专利]语音采集方法、装置、计算机设备和存储介质有效
申请号: | 201811172477.2 | 申请日: | 2018-10-09 |
公开(公告)号: | CN109256137B | 公开(公告)日: | 2021-11-12 |
发明(设计)人: | 陈东鹏 | 申请(专利权)人: | 深圳市声扬科技有限公司 |
主分类号: | G10L17/00 | 分类号: | G10L17/00;G10L17/02;G10L21/0208;G10L25/60 |
代理公司: | 广州华进联合专利商标代理有限公司 44224 | 代理人: | 王宁 |
地址: | 518000 广东省深圳市前海深港合作区前*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 语音 采集 方法 装置 计算机 设备 存储 介质 | ||
1.一种语音采集方法,所述方法包括:
接收音频流,将所述音频流分割为多个语音片段;所述语音片段包含一句或多句完整语音;
提取所述多个语音片段的声纹特征;
将所述多个语音片段的声纹特征进行两两比对,得到所述音频流对应的分数矩阵,所述分数矩阵用于表示语音片段两两之间相似度对应的分数;
根据所述分数矩阵对所述声纹特征进行聚类,并得到所述分数矩阵中同行或同列分数在预设分数阈值以上的数量,将所述数量在预设数量以下的所述同行或同列分数对应的语音片段去除,得到多种声源对应的语音片段数量;
根据语音片段数量最大的声源,提取相应的语音片段。
2.根据权利要求1所述的方法,其特征在于,所述将所述音频流分割为多个语音片段,包括:
根据机器学习模型中的历史数据识别所述音频流中多个语句的结尾;
将所述多个语句的结尾作为多个语音片段的分割点;
利用所述多个语音片段的分割点,将所述音频流分割为多个语音片段。
3.根据权利要求1所述的方法,其特征在于,所述将所述多个语音片段的声纹特征进行两两比对,得到所述音频流对应的分数矩阵,所述分数矩阵用于表示语音片段两两之间相似度对应的分数,包括:
将所述多个语音片段的声纹特征进行两两比对,得到多个声纹特征向量之间的距离;
利用所述多个声纹特征向量之间的距离生成所述多个语音片段之间的距离关系;
根据所述多个语音片段之间的距离关系计算语音片段两两之间相似度对应的分数;
根据所述语音片段两两之间相似度对应的分数生成所述音频流对应的分数矩阵。
4.根据权利要求3所述的方法,其特征在于,分割点为根据所述音频流的音量和能量识别出的人声端点。
5.根据权利要求1所述的方法,其特征在于,所述声源还包括噪声声源,在所述根据分数矩阵对所述声纹特征进行聚类,得到多种声源对应的语音片段数量,还包括:
对所述噪声声源进行过滤;
识别过滤后的声源中同种声源对应的语音片段数量。
6.一种语音采集装置,其特征在于,所述装置包括:
音频流分割模块,用于接收音频流,将所述音频流分割为多个语音片段;所述语音片段包含一句或多句完整语音;
声纹特征提取模块,用于提取所述多个语音片段的声纹特征;
声纹特征比对模块,用于将所述多个语音片段的声纹特征进行两两比对,得到所述音频流对应的分数矩阵,所述分数矩阵用于表示语音片段两两之间相似度对应的分数;
声纹特征聚类模块,用于根据所述分数矩阵对所述声纹特征进行聚类,并得到所述分数矩阵中同行或同列分数在预设分数阈值以上的数量,将所述数量在预设数量以下的所述同行或同列分数对应的语音片段去除,得到多种声源对应的语音片段数量;
语音片段提取模块,用于根据语音片段数量最大的声源,提取相应的语音片段。
7.根据权利要求6所述的装置,其特征在于,所述音频流分割模块,还用于根据机器学习模型中的历史数据识别所述音频流中的多个语句的结尾;将所述多个语句的结尾作为多个语音片段的分割点;利用所述多个语音片段的分割点,将所述音频流分割为多个语音片段。
8.根据权利要求6所述的装置,其特征在于,所述声纹特征比对模块,还用于将所述多个语音片段的声纹特征进行两两比对,得到多个声纹特征向量之间的距离;利用所述多个声纹特征向量之间的距离生成所述多个语音片段之间的距离关系;根据所述多个语音片段之间的距离关系计算语音片段两两之间相似度对应的分数;根据所述语音片段两两之间相似度对应的分数生成所述音频流对应的分数矩阵。
9.一种计算机设备,包括存储器和处理器,所述存储器存储有可在处理器上运行的计算机程序,其特征在于,所述处理器执行所述计算机程序时实现权利要求1至5中任一项所述方法的步骤。
10.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现权利要求1至5中任一项所述方法的步骤。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于深圳市声扬科技有限公司,未经深圳市声扬科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201811172477.2/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种语音识别方法和装置
- 下一篇:身份验证方法、终端设备及计算机可读存储介质