[发明专利]测量相似度的方法和设备在审
申请号: | 201510836761.5 | 申请日: | 2011-08-19 |
公开(公告)号: | CN105355214A | 公开(公告)日: | 2016-02-24 |
发明(设计)人: | 芦烈;胡明清 | 申请(专利权)人: | 杜比实验室特许公司 |
主分类号: | G10L25/51 | 分类号: | G10L25/51 |
代理公司: | 北京集佳知识产权代理有限公司 11227 | 代理人: | 杜诚;李春晖 |
地址: | 美国加利*** | 国省代码: | 美国;US |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 测量 相似 方法 设备 | ||
1.一种测量两个音频分段之间的内容相似度的方法,包括:
从所述音频分段中提取第一特征向量,其中所述第一特征向量中的每一个中的所有特征值都是非负的并被归一化,使得所述特征值的和为1;
根据所述特征向量,基于狄里克雷分布生成用于计算所述内容相似度的统计模型;以及
基于所生成的统计模型计算所述内容相似度。
2.根据权利要求1所述的方法,其中,所述提取包括:
从所述音频分段中提取第二特征向量;以及
针对所述第二特征向量中的每一个,计算用于测量该第二特征向量与参考向量中的每一个之间的关系的量,其中与所述第二特征向量相对应的所有量形成所述第一特征向量中的一个。
3.根据权利要求2所述的方法,其中,通过以下方法之一确定所述参考向量:
随机产生法,其中随机生成所述参考向量;
无监督聚类法,其中提取自训练样本的训练向量被分组为聚类,并计算所述参考向量以分别代表所述聚类;
监督建模法,其中根据所述训练向量来人工定义和学习所述参考向量;以及
特征分解法,其中将所述参考向量计算为以所述训练向量作为行的矩阵的特征向量。
4.根据权利要求2所述的方法,其中,通过以下各量之一测量所述第二特征向量与所述参考向量中的每一个之间的关系
所述第二特征向量与该参考向量之间的距离;
所述第二特征向量与该参考向量之间的相关;
所述第二特征向量与该参考向量之间的内积;以及
该参考向量的以所述第二特征向量作为相关证据的后验概率。
5.一种用于测量两个音频分段之间的内容相似度的设备,包括:
特征生成器,其从所述音频分段中提取第一特征向量,其中所述第一特征向量中的每一个中的所有特征值都是非负的并被归一化,使得所述特征值的和为1;
模型生成器,其根据所述特征向量,基于狄里克雷分布生成用于计算所述内容相似度的统计模型;以及
相似度计算器,其基于所生成的统计模型计算所述内容相似度。
6.根据权利要求5所述的设备,其中,所述特征生成器被进一步配置为,
从所述音频分段中提取第二特征向量;以及
针对所述第二特征向量中的每一个,计算用于测量该第二特征向量与参考向量中的每一个之间的关系的量,其中与所述第二特征向量相对应的所有量形成所述第一特征向量中的一个。
7.根据权利要求6所述的设备,其中,通过以下方法之一确定所述参考向量:
随机产生法,其中随机生成所述参考向量;
无监督聚类法,其中提取自训练样本的训练向量被分组为聚类,并计算所述参考向量以分别代表所述聚类;
监督建模法,其中根据所述训练向量来人工定义和学习所述参考向量;以及
特征分解法,其中将所述参考向量计算为以所述训练向量作为行的矩阵的特征向量。
8.根据权利要求6所述的设备,其中,通过以下各量之一测量所述第二特征向量与所述参考向量中的每一个之间的关系:
所述第二特征向量与该参考向量之间的距离;
所述第二特征向量与该参考向量之间的相关;
所述第二特征向量与该参考向量之间的内积;以及
该参考向量的以所述第二特征向量作为相关证据的后验概率。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于杜比实验室特许公司,未经杜比实验室特许公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201510836761.5/1.html,转载请声明来源钻瓜专利网。