[发明专利]基于几何学的语音样本筛选方法、装置及计算机设备在审
申请号: | 202011387398.0 | 申请日: | 2020-12-01 |
公开(公告)号: | CN112530409A | 公开(公告)日: | 2021-03-19 |
发明(设计)人: | 罗剑;王健宗;程宁 | 申请(专利权)人: | 平安科技(深圳)有限公司 |
主分类号: | G10L15/02 | 分类号: | G10L15/02;G10L15/06;G10L15/08;G10L15/26;G10L25/24 |
代理公司: | 深圳市精英专利事务所 44242 | 代理人: | 李翔宇 |
地址: | 518000 广东省深圳市福田区福*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 几何学 语音 样本 筛选 方法 装置 计算机 设备 | ||
1.一种基于几何学的语音样本筛选方法,其特征在于,包括:
获取初始语音样本集,提取所述初始语音样本集中每一条初始语音样本数据对应的语音特征,以组成语音特征集;其中,所述初始语音样本集中包括多条初始语音样本数据;
通过动态时间规整算法获取所述语音特征集中各语音特征之间的欧式距离,根据各语音特征之间的欧式距离进行K-means聚类,以得到聚类结果;
调用预设的样本子集筛选条件,获取所述聚类结果中满足所述样本子集筛选条件的聚类簇,以组成目标聚类簇集合;
获取所述目标聚类簇集合中每一语音特征对应的标注值,以得到与所述目标聚类簇集合对应的当前语音样本集;
将所述当前语音样本集中每一语音特征作为待训练语音识别模型的输入,将每一语音特征对应的标注值作为待训练语音识别模型的输出以对待训练语音识别模型进行训练,得到语音识别模型;其中,所述待训练语音识别模型中包括链接时序分类子模型和基于注意力机制子模型;以及
若检测到用户端上传的当前待识别语音数据,将所述当前待识别语音数据对应的语音特征输入至所述语音识别模型进行运算,得到并向用户端发送当前语音识别结果。
2.根据权利要求1所述的基于几何学的语音样本筛选方法,其特征在于,所述获取初始语音样本集,提取所述初始语音样本集中每一条初始语音样本数据对应的语音特征,以组成语音特征集,包括:
调用预先存储的采样周期将所述初始语音样本集中每一条初始语音样本数据分别进行采样,得到与每一条初始语音样本数据对应的当前离散语音信号;
调用预先存储的一阶FIR高通数字滤波器对每一条初始语音样本数据对应的当前离散语音信号分别进行预加重,得到与每一条初始语音样本数据对应的当前预加重语音信号;
调用预先存储的汉明窗对与每一条初始语音样本数据对应的当前预加重语音信号分别进行加窗,得到与每一条初始语音样本数据对应的加窗后语音数据;
调用预先存储的帧移和帧长对与每一条初始语音样本数据对应的加窗后语音数据分别进行分帧,得到与每一条初始语音样本数据对应的预处理后语音数据;
将每一条初始语音样本数据对应的预处理后语音数据分别进行梅尔频率倒谱系数提取或是滤波器组提取,得到与每一条初始语音样本数据对应的语音特征,以组成语音特征集。
3.根据权利要求1所述的基于几何学的语音样本筛选方法,其特征在于,所述通过动态时间规整算法获取所述语音特征集中各语音特征之间的欧式距离,包括:
获取所述语音特征集中第i号语音特征及第j号语音特征;其中,所述语音特征集中包括N个语音特征,i和j的取值范围均是[1,N],且i与j不相等;
判断第i号语音特征对应的第一语音序列帧数是否等于第j号语音特征对应的第二语音序列帧数;
若第i号语音特征对应的第一语音序列帧数不等于第j号语音特征对应的第二语音序列帧数,构造n*m的距离矩阵D,获取距离矩阵D中各矩阵元素中的最小值以作为所述第i号语音特征与第j号语音特征的欧式距离;其中,n等于第一语音序列帧数,m等于第二语音序列帧数,距离矩阵D中d(x,y)表示第i号语音特征中第x帧语音序列与第j号语音特征中第y帧语音序列之间的欧氏距离。
4.根据权利要求3所述的基于几何学的语音样本筛选方法,其特征在于,所述判断第i号语音特征对应的第一语音序列帧数是否等于第j号语音特征对应的第二语音序列帧数之后,还包括:
若第i号语音特征对应的第一语音序列帧数等于第j号语音特征对应的第二语音序列帧数,计算得到所述第i号语音特征与第j号语音特征的欧式距离。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于平安科技(深圳)有限公司,未经平安科技(深圳)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202011387398.0/1.html,转载请声明来源钻瓜专利网。