[发明专利]一种基于贪心算法的语音相似度计算方法和装置在审
申请号: | 201810940763.2 | 申请日: | 2018-08-17 |
公开(公告)号: | CN110890086A | 公开(公告)日: | 2020-03-17 |
发明(设计)人: | 吴威;张楠赓 | 申请(专利权)人: | 北京嘉楠捷思信息技术有限公司 |
主分类号: | G10L15/10 | 分类号: | G10L15/10;G10L15/28;G10L25/27 |
代理公司: | 北京市中伦律师事务所 11410 | 代理人: | 杨黎峰;钟锦舜 |
地址: | 100094 北京市海淀*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 贪心 算法 语音 相似 计算方法 装置 | ||
1.一种基于贪心算法的语音相似度计算方法,其特征在于,所述方法包括:
获取含有N帧语音特征矢量的测试序列V=(V1,V2,..,VN)与含有M帧语音特征矢量的模板序列U=(U1,U2,…,UM);
基于滑动窗口依次截取所述测试序列中的元素组(Vn,Vn+1)作为第n个局部测试序列V′n;
针对每一个局部测试序列,动态截取所述模板序列的连续i帧作为对应的局部模板序列;
基于所述每一个局部测试序列与所述对应的所述局部模板序列建立局部相似度矩阵;
基于所述局部相似度矩阵,利用贪心算法获取所述测试序列与所述模板序列的全局相似度;
其中,所述n为大于0且小于N的整数,i为大于1且小于M的整数。
2.根据权利要求1所述的方法,其特征在于,所述基于滑动窗口依次截取所述测试序列中的元素组(Vn,Vn+1)作为局部测试序列V′n具体包括:
对n依次从1到N-1进行取值,以获取所述每一个局部测试序列。
3.根据权利要求1所述的方法,其特征在于,所述针对每一个局部测试序列,动态截取所述模板序列的连续i帧作为对应的局部模板序列具体包括:
预设所述局部模板序列初始值;
根据所述局部模板序列初始值通过预设递推运算规则依次动态截取所述模板序列,以获得与每一个所述局部测试序列相对应的所述局部模板序列。
4.根据权利要求3所述的方法,其特征在于,所述预设所述局部模板序列初始值具体包括:
将局部测试序列初始值V′1=(V1,V2)对应的所述局部模板序列初始值预设为U′1=(U1,…,U1+i-1)。
5.根据权利要求3所述的方法,其特征在于,所述通过预设递推运算规则依次动态截取所述模板序列具体包括:
计算获得第n个局部相似度矩阵的最优路径;
将所述最优路径经过测试序列的Vn+1时所对应的模板语音帧设为第n+1个所述局部模板序列的起始帧;以及
根据所述第n+1个局部模板序列的起始帧依照时序向后截取i帧作为所述第n+1个局部模板序列。
6.根据权利要求1所述的方法,其特征在于,所述基于所述局部测试序列与所述局部模板序列建立局部相似度矩阵还包括:
计算所述局部测试序列与所述局部模板序列之间每一帧语音特征矢量之间的匹配度L。
7.根据权利要求1所述的方法,其特征在于,所述基于所述局部相似度矩阵利用贪心算法获取所述测试序列与所述模板序列的全局相似度值还包括:
计算所述局部相似度矩阵的局部最优路径以及局部相似度值;
将全部的所述局部相似度最优路径首尾相连获得全局最优路径;以及
将全部的所述局部相似度值累加后求均值,获得所述全局相似度值。
8.根据权利要求5或7所述的方法,其特征在于,所述局部最优路径具体为:
由所述局部相似度矩阵中的位置(Vn,Um)指向位置((Vn+1,Um),…,(Vn+1,Um+i-1))中具有最大匹配度L的一项;
其中,所述局部相似度矩阵由局部测试序列(Vn,Vn+1)与所述局部模板序列(Um,…,Um+i-1)组成。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京嘉楠捷思信息技术有限公司,未经北京嘉楠捷思信息技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201810940763.2/1.html,转载请声明来源钻瓜专利网。