[发明专利]文本行提取方法和文本行提取设备有效
申请号: | 201510021514.X | 申请日: | 2015-01-15 |
公开(公告)号: | CN105844207B | 公开(公告)日: | 2019-03-29 |
发明(设计)人: | 汪留安;田中宏;范伟;孙俊 | 申请(专利权)人: | 富士通株式会社 |
主分类号: | G06K9/00 | 分类号: | G06K9/00;G06K9/34;G06F17/21 |
代理公司: | 北京集佳知识产权代理有限公司 11227 | 代理人: | 康建峰;吴琼 |
地址: | 日本神*** | 国省代码: | 日本;JP |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明公开了文本行提取方法和文本行提取设备。根据本发明的文本行提取方法包括:提取输入文档图像中的连通域;确定连通域之间的潜在链接;调整潜在链接构成的生成树;以及基于调整后的生成树,优化与生成树对应的文本行,使得文本行中字符的总差异最小。根据本发明的文本行提取方法和文本行提取设备能够准确地、鲁棒地提取出文档图像中的文本行。 | ||
搜索关键词: | 文本 提取 方法 和文 本行 设备 | ||
【主权项】:
1.一种文本行提取方法,包括:提取输入文档图像中的连通域;针对每个连通域,确定多个预定方向上的候选链接;针对每个候选链接,计算所述候选链接的权值;根据所述候选链接的权值的大小,选取预定数量的所述候选链接作为所述连通域之间的潜在链接;调整所述潜在链接构成的生成树;以及基于调整后的生成树,优化与所述生成树对应的文本行,使得所述文本行中字符的总差异最小。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于富士通株式会社,未经富士通株式会社许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201510021514.X/,转载请声明来源钻瓜专利网。