[发明专利]模型生成装置、模式识别设备及其方法有效

专利信息
申请号: 201310064923.9 申请日: 2013-03-01
公开(公告)号: CN104021390B 公开(公告)日: 2018-01-02
发明(设计)人: 沈海峰;赵元;陶训强;山本宽树 申请(专利权)人: 佳能株式会社
主分类号: G06K9/62 分类号: G06K9/62
代理公司: 中国国际贸易促进委员会专利商标事务所11038 代理人: 罗银燕
地址: 日本*** 国省代码: 暂无信息
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 模型 生成 装置 模式识别 设备 及其 方法
【说明书】:

技术领域

发明涉及模式识别领域,尤其涉及用于模式识别的模型生成装置、模式识别设备及其方法。

背景技术

迄今,模式识别技术已得到迅速的发展,并已被广泛地用于进行手势识别、手写字符识别、语音识别、说话者识别等。

在模式识别领域中,模型生成方法对于所需的存储器大小以及模式识别性能具有重要的影响。

通常的模型生成方法并不具有任何方差共享机制。图1示意性地示出这种无方差共享的方法。这里,出于简化的目的,假设每个模型除两个虚状态之外具有两个实状态(实状态是指既具有转移概率又具有输出概率的状态,而虚状态是指仅具有转移概率而不具有输出概率的状态)。此外,假设每个实状态具有两个混合分量,而每个混合分量例如是多维高斯分布。在图中,在每个高斯分布的下方都以双箭头的形式示出了该高斯分布的方差,双箭头的长短对应于方差值的大小。如图1所示,在模型1中,实状态1的混合分量的方差依次为 V1和V2,实状态2的混合分量的方差依次为V3和V4;而在模型2 中,实状态1的混合分量的方差依次为V5和V6,实状态2的混合分量的方差依次为V7和V8。在图1所示的无方差共享方法中,方差V1~V8的值可能是不同的。

出于诸如减小存储器大小或获得良好的模型参数估计等的目的,在模型生成过程中可以使用方差共享方法。

US2005/0192806A1公开了全局固定(Grand-fixed)方差共享方法。根据该方法,通过对多个概率密度函数的方差进行平均化而获得一个全局方差。图2示意性地示出全局固定方差共享方法。如图2 所示,各模型的各实状态中的各混合分量的方差都相同,即,都为V。

另外,文献Wei-Qiang Zhang and Jia Liu(2011),‘Discriminative Universal Background Model Training for Speaker Recognition’, Speech and Language Technologies,Prof.Ivo Ipsic(Ed.),ISBN: 978-953-307-322-4,InTech公开了通用背景模型(Universal Background Model,UBM)方差共享方法。根据该方法,对UBM进行训练,并且所有的目标说话者模型共享该UBM中的方差。图3示意性地示出UBM方差共享方法。如图3所示,各模型中具有相同状态标号的状态共享相同的方差。更具体而言,对于模型1的实状态1 与模型2的实状态1而言,其混合分量的方差共享,即,模型1的实状态1中的混合分量的方差依次为V1和V2,而模型2的实状态1 中的混合分量的方差也依次为V1和V2。并且,对于模型1的实状态2与模型2的实状态2而言,其混合分量的方差共享,即模型1 的实状态2中的混合分量的方差依次为V3和V4,而模型2的实状态2中的混合分量的方差也依次为V3和V4。

然而,上述文献中的方法各自存在限制。

在US2005/0192806A1公开的全局固定方差共享方法中,由于仅使用一个全局固定方差,因此方差的分辨率通常并不太好。鉴于此,补偿因子被采用。但是,由于在解码过程中会频繁地调用高斯概率计算处理,使得该过程由于用于处理补偿因子的额外的乘运算或除运算而产生太大的计算量。此外,还需要有额外的存储器来存储补偿因子。

另外,在Wei-Qiang Zhang等人公开的UBM方差共享方法中,由于所有目标模型具有与UBM相同的状态拓扑,因此其难以应对目标模型具有不同的状态数或具有不同的每一状态的混合分量数的情况。此外,在有限训练数据的情况下,该方法有可能由于需要估计较多的方差而不能提供良好的模型参数估计。

因此,希望能够提供一种新的用于模式识别的模型生成装置、模式识别设备及其方法。

发明内容

鉴于以上问题中的至少一个提出本发明。

本发明的一个目的是提供一种新的用于模式识别的模型生成装置、模式识别设备及其方法。

本发明的另一目的是提供一种用于模式识别的模型生成装置、模式识别设备及其方法,其至少能够适当地减少模型参数的数目,从而适当地减小存储器大小。

本发明的又一目的是提供一种用于模式识别的模型生成装置、模式识别设备及其方法,其至少能够在有限训练数据的情况下提供较好的模型参数估计,从而提供较好的识别性能。

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于佳能株式会社,未经佳能株式会社许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/201310064923.9/2.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top