[发明专利]一种语种向量获得、语种识别的方法和相关装置有效
申请号: | 201910470489.1 | 申请日: | 2019-05-31 |
公开(公告)号: | CN110164417B | 公开(公告)日: | 2021-07-06 |
发明(设计)人: | 李晋;方昕;方四安;柳林;徐承 | 申请(专利权)人: | 科大讯飞股份有限公司 |
主分类号: | G10L15/02 | 分类号: | G10L15/02;G10L15/04;G10L15/06;G10L15/26 |
代理公司: | 北京集佳知识产权代理有限公司 11227 | 代理人: | 张小娜 |
地址: | 230088 安徽*** | 国省代码: | 安徽;34 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 语种 向量 获得 识别 方法 相关 装置 | ||
1.一种语种向量获得的方法,其特征在于,包括:
基于各个语音数据和各个所述语音数据切分获得的语音片段,利用全变量因子分析技术获得各个所述语音数据的语种向量和各个所述语音片段的语种向量;所述语音片段的时长符合预设时长范围;
基于各个所述语音数据的语种向量和各个所述语音片段的语种向量,进行时长干扰属性投影处理获得时长干扰投影矩阵;
利用所述时长干扰投影矩阵将各个所述语音数据的语种向量映射为各个所述语音数据的新语种向量;
所述基于各个所述语音数据的语种向量和各个所述语音片段的语种向量,进行时长干扰属性投影处理获得时长干扰投影矩阵,包括:
基于各个所述语音数据对应的语种标识的类别总数、每类所述语种标识对应的所述语音数据的语音总数、每个所述语音数据切分获得的所述语音片段的片段总数、各个所述语音数据的语种向量和各个所述语音片段的语种向量,进行类内方差相关处理获得语种向量时长类内方差;
对所述语种向量时长类内方差进行特征分解相关处理获得时长干扰矩阵;
基于单位矩阵和所述时长干扰矩阵,获得所述时长干扰投影矩阵。
2.根据权利要求1所述的方法,其特征在于,所述预设时长范围由第一预设时长和第二预设时长组成,所述第一预设时长小于所述第二预设时长,所述语音数据的时长大于所述第二预设时长,所述语音数据切分获得所述语音片段的步骤包括:
每次切分前基于所述预设时长范围随机确定随机切分时长;
按照所述随机切分时长切分所述语音数据获得所述语音片段。
3.根据权利要求1所述的方法,其特征在于,所述基于各个语音数据和各个所述语音数据切分获得的语音片段,利用全变量因子分析技术获得各个所述语音数据的语种向量和各个所述语音片段的语种向量,包括:
提取各个所述语音数据的语种特征和各个所述语音片段的语种特征,利用全变量因子分析技术获得全变量空间;
基于各个所述语音数据的语种特征、各个所述语音片段的语种特征和所述全变量空间,获得各个所述语音数据的语种向量和各个所述语音片段的语种向量。
4.根据权利要求1所述的方法,其特征在于,所述对所述语种向量时长类内方差进行特征分解相关处理获得时长干扰矩阵,包括:
对所述语种向量时长类内方差进行特征分解获得各个特征值和各个所述特征值对应的特征向量;
基于各个所述特征值的大小由大到小排序各个所述特征值;
选取排序后各个所述特征值中前r个特征值对应的特征向量按序组成所述时长干扰矩阵;所述r为正整数,所述r小于各个所述特征值的总数。
5.根据权利要求1所述的方法,其特征在于,所述基于单位矩阵和所述时长干扰矩阵,获得所述时长干扰投影矩阵,包括:
将所述时长干扰矩阵和所述时长干扰矩阵的转置矩阵相乘获得矩阵乘积;
将所述单位矩阵和所述矩阵乘积相减获得所述时长干扰投影矩阵。
6.根据权利要求1所述的方法,其特征在于,还包括:
基于每类所述语种标识对应的所述语音数据的新语种向量,进行平均处理获得每类语种标识对应的语种标准向量。
7.一种语种识别的方法,其特征在于,利用权利要求1-6任一项所述的时长干扰投影矩阵,包括:
提取待识别语音数据的语种特征,利用预先获得的全变量空间获得所述待识别语音数据的语种向量;
利用所述时长干扰投影矩阵将所述待识别语音数据的语种向量映射为所述待识别语音数据的新语种向量;
获得所述待识别语音数据的新语种向量与每类语种标识对应的语种标准向量的相似度;所述每类语种标识对应的语种标准向量是预先获得的;
基于所述相似度确定最大相似度对应的语种标识为所述待识别语音数据的语种标识。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于科大讯飞股份有限公司,未经科大讯飞股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910470489.1/1.html,转载请声明来源钻瓜专利网。