[发明专利]语音采集方法、装置、计算机设备和存储介质有效

申请号：	201811172477.2	申请日：	2018-10-09
公开（公告）号：	CN109256137B	公开（公告）日：	2021-11-12
发明（设计）人：	陈东鹏	申请（专利权）人：	深圳市声扬科技有限公司
主分类号：	G10L17/00	分类号：	G10L17/00;G10L17/02;G10L21/0208;G10L25/60
代理公司：	广州华进联合专利商标代理有限公司 44224	代理人：	王宁
地址：	518000 广东省深圳市前海深港合作区前***	国省代码：	广东;44
权利要求书：	查看更多	说明书：	查看更多
摘要：
搜索关键词：	语音采集方法装置计算机设备存储介质
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【说明书】：

本申请涉及一种语音采集方法、装置、计算机设备及存储介质，接收音频流，将所述音频流分割为多个语音片段；提取所述多个语音片段的声纹特征；将所述多个语音片段的声纹特征进行两两比对，得到所述音频流对应的分数矩阵，所述分数矩阵用于表示语音片段两两之间相似度对应的分数；根据所述分数矩阵对所述声纹特征进行聚类，得到多种声源对应的语音片段数量；根据语音片段数量最大的声源，提取相应的语音片段。采用本方法能够避免因语音质量问题增加后期人工操作，提高了语音采集效率。

技术领域

本申请涉及语音技术领域，特别是涉及一种语音采集方法、装置、计算机设备和存储介质。

背景技术

随着语音技术的发展，对于语音的要求越来越高，语音采集作为语音机器学习模型训练的基础和重要环节，需要对语音质量进行严格把控。在语音采集过程中，语音质量极易受到各种因素的影响。例如，语音中混入噪声。但是，该混入噪声的语音中大部分语音片段是合格的。然而，在传统的语音采集方式中，即使混入噪声的语音中大部分语音片段是合格的，也会被认定为整段语音不合格。为了将不合格的小部分语音去除，需要进行人工剪辑，或是将整段语音放弃进行重新采集，费时费力，存在语音采集效率较低的技术问题。

发明内容

基于此，有必要针对上述技术问题，提供一种能够提高语音采集效率的语音采集计算方法、装置、计算机设备和存储介质。

一种语音采集方法，所述方法包括：

接收音频流，将所述音频流分割为多个语音片段；

提取所述多个语音片段的声纹特征；

将所述多个语音片段的声纹特征进行两两比对，得到所述音频流对应的分数矩阵，所述分数矩阵用于表示语音片段两两之间相似度对应的分数；

根据所述分数矩阵对所述声纹特征进行聚类，得到多种声源对应的语音片段数量；

根据语音片段数量最大的声源，提取相应的语音片段。

在其中一个实施例中，所述将所述音频流分割为多个语音片段，包括：

根据机器学习模型中的历史数据识别所述音频流中的多个语句的结尾；将所述多个语句的结尾作为多个语音片段的分割点；利用所述多个语音片段的分割点，将所述音频流分割为多个语音片段。

在其中一个实施例中，所述将所述多个语音片段的声纹特征进行两两比对，得到所述音频流对应的分数矩阵，所述分数矩阵用于表示语音片段两两之间相似度对应的分数，包括：

将所述多个语音片段的声纹特征进行两两比对，得到多个声纹特征向量之间的距离；