[发明专利]一种基于HMM-GMM的自动文字图片切分方法及系统在审
申请号: | 201510489963.7 | 申请日: | 2015-08-11 |
公开(公告)号: | CN105160342A | 公开(公告)日: | 2015-12-16 |
发明(设计)人: | 刘世林;何宏靖;陈炳章;吴雨浓 | 申请(专利权)人: | 成都数联铭品科技有限公司 |
主分类号: | G06K9/34 | 分类号: | G06K9/34 |
代理公司: | 暂无信息 | 代理人: | 暂无信息 |
地址: | 610041 四川省成都市高新区*** | 国省代码: | 四川;51 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发涉及图像识别领域,特别涉及一种基于HMM-GMM的自动文字图片切分方法及系统。本发明应用了隐式马尔科夫模型和混合高斯模型的技术,通过对每个待识别文字构建对应HMM模型,使用前后向算法对GMM和跳转参数的进行监督学习,完成对模型的训练,再根据待识别文字图片的观测值序列,使用Viterbi算法计算出得到该观测值序列概率最大的对应隐含状态序列S1...L,根据S1...L与HMM的映射关系找到文字图片的切分点;进而实现文字图片切分的自动化,本发明方法系统减少了人力标注切分点成本,克服了传统文字图片切分方法的缺陷;显著提高了切分效率;在基于文字图片识别的信息挖掘和图片搜索领域具有巨大的应用前景。 | ||
搜索关键词: | 一种 基于 hmm gmm 自动 文字 图片 切分 方法 系统 | ||
【主权项】:
一种基于HMM‑GMM的自动文字图片切分方法,其特征是:将待处理文字图片转换成时序数据,依次提取特征观测值序列O1.....T=[o1 . . . oT];在提取出特征观测值序列的基础上,使用HMM‑GMM对待处理文字图片中的每一字符进行序列建模,完成HMM模型训练;根据待识别文字图片的观测值序列O1...L=[o1 . . . oL],使用Viterbi算法计算出得到所述O1.....L=[o1 . . . oL]概率最大的对应隐含状态序列S1...L,根据S1...L与HMM的对应关系找到文字图片的切分点;进而实现文字图片切分的自动化。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于成都数联铭品科技有限公司,未经成都数联铭品科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201510489963.7/,转载请声明来源钻瓜专利网。