[发明专利]一种基于45度斜线滚动的动态时间规整方法和系统有效
申请号: | 201210553170.3 | 申请日: | 2012-12-18 |
公开(公告)号: | CN103871412A | 公开(公告)日: | 2014-06-18 |
发明(设计)人: | 许云峰 | 申请(专利权)人: | 联芯科技有限公司 |
主分类号: | G10L17/08 | 分类号: | G10L17/08 |
代理公司: | 上海思微知识产权代理事务所(普通合伙) 31237 | 代理人: | 石湘波 |
地址: | 201206 上*** | 国省代码: | 上海;31 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 45 斜线 滚动 动态 时间 规整 方法 系统 | ||
技术领域
本发明涉及通信技术领域,特别涉及一种基于45度斜线滚动的动态时间规整方法和系统。
背景技术
随着科学技术的发展,生物测量技术越来越多的被运用到各个领域。特别是生物特征对于每个个体来说都是唯一的,所以有非常不错的加密特性。常用的生物特征比如:指纹、虹膜、人脸以及语音。
在说话人识别和语音识别中,时间规整技术是一种比较老的算法,这项技术需要比较大的数据空间和计算量,所以限制了这项技术的运用。虽然如此,但是这项技术在训练语料较少的情况下,其识别精度非常高。相对于统计模型的方法(如:混合高斯概率密度(GMM)与隐马尔科夫链(HMM)等概率模型),时间规整技术不需要太多的训练语料,因此实用性较强。
在常用的说话人识别中,一般会首先会进行模板注册,目的提取目标说话人的语音的特征矢量序列R,R是由人的声道测量的特征矢量组成的序列。在识别过程中,首先提取测试说话人的语音特征矢量序列T,T是由人的声道测量的特征矢量组成的序列,然后来计算这两个特征矢量序列的矢量距离,来判断该说话人是否是目标说话人。由于每次说话的时候,语速可能发生变化,所以需要对语速变化进行规整,在此就运用到了动态时间规整技术(DTW)。
动态时间规整技术采用对时间补齐的方法进行模板的矢量距离的计算并累加。计算两个矢量的距离的方法如下:
定义目标说话人的特征矢量序列R的第j特征矢量为:
定义测试说话人的特征矢量序列T的第i特征矢量为:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于联芯科技有限公司,未经联芯科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201210553170.3/2.html,转载请声明来源钻瓜专利网。