[发明专利]一种富格式文档的图形识别方法和系统在审
申请号: | 202210477699.5 | 申请日: | 2022-05-05 |
公开(公告)号: | CN114724165A | 公开(公告)日: | 2022-07-08 |
发明(设计)人: | 王俊;乔美萱;向俊夫;侯启予 | 申请(专利权)人: | 南京吾道知信信息技术有限公司 |
主分类号: | G06V30/414 | 分类号: | G06V30/414;G06V30/413;G06N3/08;G06N3/04;G06K9/62;G06V10/764;G06V10/82;G06V10/25 |
代理公司: | 北京棘龙知识产权代理有限公司 11740 | 代理人: | 李改平 |
地址: | 211100 江苏省南京市江宁*** | 国省代码: | 江苏;32 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明公开了一种富格式文档的图形识别方法和系统,属于图形识别技术领域,所述方法包括:识别文档页面中图形的区域和类别;基于所述图形类别,获得图形区域中的对象,所述对象包括:形状对象、文本块和连线;根据文本块所在的位置,建立文本块与形状对象或连线的关联;根据连线的端点,找到连线的邻近对象;根据连线的类别,将相邻连线进行整合,获得整合连线;建立所述整合连线、邻近形状对象和文本块的关联,并获得结构化信息。图形类别不同,对象的形式和连接形式不同,基于图形类别的图形识别,可以有效提高识别的准确性;根据连线的类别,将连线的各个连线进行整合,获得整合连线,利于识别复杂图形中对象之间连接关系。 | ||
搜索关键词: | 一种 格式 文档 图形 识别 方法 系统 | ||
【主权项】:
暂无信息
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于南京吾道知信信息技术有限公司,未经南京吾道知信信息技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/202210477699.5/,转载请声明来源钻瓜专利网。
- 上一篇:一种可调节型眼科手术头位固定器
- 下一篇:一种智能防盗型收款机