[发明专利]一种版式识别模板方法及系统无效
申请号: | 201010610885.9 | 申请日: | 2010-12-29 |
公开(公告)号: | CN102081732A | 公开(公告)日: | 2011-06-01 |
发明(设计)人: | 周长岭;赵海涛 | 申请(专利权)人: | 方正国际软件有限公司;方正国际软件(北京)有限公司 |
主分类号: | G06K9/00 | 分类号: | G06K9/00;G06K9/20 |
代理公司: | 北京天悦专利代理事务所(普通合伙) 11311 | 代理人: | 田明;任晓航 |
地址: | 215123 江苏省苏州工业*** | 国省代码: | 江苏;32 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明涉及一种版式识别模板方法及系统,属于文字识别技术领域,包括如下步骤:对于扫描页面进行轮廓分析,查找出与页面连通域重合率达到设定阀值的版式模板;将所述版式模板中的标记块与扫描页面中的信息进行匹配,提取并识别已匹配标记块的页眉页角信息;切去已识别的所述标记块,提交给后续识别流程。本发明通过采用区域识别模板对版面固定格式区域版面进行识别,并将其从识别目标中剥离,提升了页面区域内识别的效率,采用本发明所述的方法,简化了一般扫描页面识别的内容,并且基于此模板能够方便的通过人工进行识别管理。 | ||
搜索关键词: | 一种 版式 识别 模板 方法 系统 | ||
【主权项】:
一种版式识别模板方法,包括如下步骤:(S1)对扫描页面进行轮廓分析,查找出与页面连通域重合率达到设定阀值的版式模板;(S2)将所述版式模板中的标记块与扫描页面中的信息进行匹配,提取并识别已匹配标记块的页眉页角信息;(S3)切去扫描页面中已识别的标记块所对应的信息,将处理后的扫描页面提交给后续识别流程。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于方正国际软件有限公司;方正国际软件(北京)有限公司,未经方正国际软件有限公司;方正国际软件(北京)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201010610885.9/,转载请声明来源钻瓜专利网。
- 上一篇:用于柠檬酸生产的中和反应釜
- 下一篇:翻缸式捏合机