[发明专利]多视角向量处理方法和设备有效
申请号: | 201710343390.6 | 申请日: | 2017-05-16 |
公开(公告)号: | CN108875463B | 公开(公告)日: | 2022-08-12 |
发明(设计)人: | 石自强;刘柳;刘汝杰 | 申请(专利权)人: | 富士通株式会社 |
主分类号: | G06K9/00 | 分类号: | G06K9/00;G10L17/04;G10L15/06;G10L15/02 |
代理公司: | 北京集佳知识产权代理有限公司 11227 | 代理人: | 李春晖;李德山 |
地址: | 日本神*** | 国省代码: | 暂无信息 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 视角 向量 处理 方法 设备 | ||
1.一种用于声纹识别的多视角向量处理方法,其中,所述多视角向量x用于表征包含至少两个不可分立的视角的信息的对象并且所述对象是声纹,该方法包括:
建模步骤,建立该多视角向量的模型,使得其至少包含以下分量:所述多视角向量的总体均值μ;所述多视角向量的每一个视角的分量;以及噪声∈;以及
训练步骤,利用所述多视角向量x的训练数据获得所述总体均值μ、每一个视角的分量的参数和所述噪声∈的参数,
其中,所述多视角向量是运用分类器对直接向量化对象所获得的特征向量进行处理得到的,
其中,所述分类器能够将所述多视角向量从对要表征的对象直接进行向量化获得的特征向量中相对分离出来,其中,被排除的视角与所述多视角向量的多个视角之间的可分立性,高于所述多个视角之间的可分立性,其中两个视角之间可分立表示每一个视角都有可能为空或者为零而另一个视角能够独立存在,并且
其中,所述分类器通过以下方法训练:
同时对训练样本的不可分立的所述多个视角的特征进行标记,其中,未标记的视角与标记的视角之间的可分立性,高于所标记的视角之间的可分立性;以及
用所标记的训练样本训练所述分类器。
2.如权利要求1所述的方法,其中,每一个视角的分量基于相应视角空间基Si与该视角的特定选择的系数ui之积,其中i为视角的序号。
3.如权利要求2所述的方法,其中,将所述噪声设定为满足以对角矩阵∑为协方差的高斯分布。
4.如权利要求3所述的方法,其中,所述训练步骤包括:利用最大期望算法,利用所述训练数据获得所述总体均值μ、每一个视角的空间基Sn和所述∑。
5.如权利要求3所述的方法,其中所述多视角向量包括两个视角,记相应视角的空间基为S和T,则多视角向量被表示为:
xijk=μ+Sui+Tvj+∈ijk
其中μ表示所述总体均值,ui为与空间基S对应的视角的第i种选择的系数,vj为与空间基T对应的视角的第j种选择的系数,∈ijk表示所述噪声,k表示在前述选择的情况下的第k种样本。
6.如权利要求1-5之一所述的方法,还包括:
利用所述总体均值μ、每一个视角的分量的参数和所述噪声∈的参数,计算两个多视角向量的至少一个视角分量相同和不同的似然性,依据该似然性判断两个多视角向量的至少一个视角分量是否相同。
7.如权利要求6所述的方法,用于判断两个多视角向量中的所有视角分量是否均相同。
8.一种用于声纹识别的多视角向量处理设备,包括处理器和存储有程序代码的存储介质,所述程序代码当被处理器执行时,实现如权利要求1-7之一所述的方法。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于富士通株式会社,未经富士通株式会社许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201710343390.6/1.html,转载请声明来源钻瓜专利网。