[发明专利]多视角向量处理方法和设备有效
申请号: | 201711267389.6 | 申请日: | 2017-12-05 |
公开(公告)号: | CN109872725B | 公开(公告)日: | 2022-10-18 |
发明(设计)人: | 石自强;刘柳;刘汝杰;林慧镔 | 申请(专利权)人: | 富士通株式会社 |
主分类号: | G10L25/51 | 分类号: | G10L25/51;G10L25/27;G10L25/03;G10L17/06 |
代理公司: | 北京集佳知识产权代理有限公司 11227 | 代理人: | 杜诚;王鹏 |
地址: | 日本神*** | 国省代码: | 暂无信息 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 视角 向量 处理 方法 设备 | ||
1.一种多视角向量处理方法,其中,所述多视角向量x用于表征包含至少两个不可分立的视角的信息的对象,该方法包括:
建模步骤,建立该多视角向量的模型,使得其至少包含以下分量:所述多视角向量的总体均值μ;所述多视角向量的每一个视角的分量;以及噪声
训练步骤,利用所述多视角向量x的训练数据获得所述总体均值μ、每一个视角的分量的参数和所述噪声的参数;以及
匹配步骤,利用所述总体均值μ、每一个视角的分量的参数和所述噪声的参数,计算两个多视角向量的各个视角分量相同和不同的似然性分量,对所计算的似然性分量进行预处理以获得近似似然性,并且依据所述近似似然性来判断两个多视角向量是否匹配。
2.如权利要求1所述的方法,其中,所述预处理根据多视角向量中的各个视角分量的属性来选择一个似然性分量作为近似似然性。
3.如权利要求1所述的方法,其中,所述预处理选择具有最大值的似然性分量作为近似似然性。
4.如权利要求1所述的方法,其中,每一个视角的分量基于相应视角空间基Si与该视角的特定选择的系数ui之积,其中i为视角的序号。
5.如权利要求4所述的方法,其中,将所述噪声设定为满足以对角矩阵∑为协方差的高斯分布。
6.如权利要求5所述的方法,其中,所述训练步骤包括:利用最大期望算法,利用所述训练数据获得所述总体均值μ、每一个视角的空间基Sn和所述∑。
7.如权利要求5所述的方法,其中所述多视角向量包括两个视角,记相应视角的空间基为S和T,则多视角向量被表示为:
xijk=μ+Sui+Tvj+∈ijk
其中μ表示所述总体均值,ui为与空间基S对应的视角的第i种选择的系数,vj为与空间基T对应的视角的第j种选择的系数,∈ijk表示所述噪声,k表示在前述选择的情况下的第k种样本。
8.如权利要求1至7中任一项所述的方法,其中,所述多视角向量是表征讲话者的声纹的二视角向量,其中讲话者和讲话者所讲的内容是所述二视角向量的视角分量。
9.一种多视角向量处理设备,包括处理器和存储有程序代码的存储介质,所述程序代码当被处理器执行时,实现如权利要求1至7中任一项所述的方法。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于富士通株式会社,未经富士通株式会社许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201711267389.6/1.html,转载请声明来源钻瓜专利网。