[发明专利]文档版式检测方法、装置和电子设备在审
申请号: | 202310791204.0 | 申请日: | 2023-06-29 |
公开(公告)号: | CN116824609A | 公开(公告)日: | 2023-09-29 |
发明(设计)人: | 马伟洪;吕鹏原;章成全;姚锟 | 申请(专利权)人: | 北京百度网讯科技有限公司 |
主分类号: | G06V30/412 | 分类号: | G06V30/412;G06V30/19;G06V10/82 |
代理公司: | 北京市汉坤律师事务所 11602 | 代理人: | 姜浩然;吴丽丽 |
地址: | 100085 北京市*** | 国省代码: | 北京;11 |
权利要求书: | 暂无信息 | 说明书: | 暂无信息 |
摘要: | 本公开提供了一种文档版式检测方法、装置和电子设备,涉及人工智能技术领域,尤其涉及计算机视觉、图像处理、深度学习等技术领域,可应用于智慧政务等场景。实现方案为:获取待检测文档的图像;提取图像的多个尺度的特征图;基于多个尺度的特征图,执行全局注意力编码操作;基于全局注意力编码操作的结果,针对每个尺度的特征图生成用于指示至少一个特征点中的每个特征点的候选检测框,以获得与多个尺度的特征图有关的多个候选检测框;基于多个候选检测框中达到预定置信度的候选检测框,确定用于执行全局注意力解码操作的查询特征并执行全局注意力解码操作;以及基于全局注意力解码操作的结果,确定待检测文档中包括的至少一种版式的类别。 | ||
搜索关键词: | 文档 版式 检测 方法 装置 电子设备 | ||
【主权项】:
暂无信息
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京百度网讯科技有限公司,未经北京百度网讯科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/202310791204.0/,转载请声明来源钻瓜专利网。