[发明专利]文档布局的解析方法、装置、电子设备和存储介质有效
申请号: | 202010484261.0 | 申请日: | 2020-06-01 |
公开(公告)号: | CN111832396B | 公开(公告)日: | 2023-07-25 |
发明(设计)人: | 曾凯;路华;彭艺宇 | 申请(专利权)人: | 北京百度网讯科技有限公司 |
主分类号: | G06V30/414 | 分类号: | G06V30/414;G06F40/30 |
代理公司: | 北京清亦华知识产权代理事务所(普通合伙) 11201 | 代理人: | 石茵汀 |
地址: | 100085 北京市*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 文档 布局 解析 方法 装置 电子设备 存储 介质 | ||
1.一种文档布局的解析方法,包括:
获取目标文档之中的多个字符以及所述多个字符的字符信息,其中,所述字符信息包括字符的大小、字符的位置信息,字符的位置是字符在当前文档页面中的位置;
根据所述多个字符以及所述多个字符的字符信息生成字符全连接图,其中,所述字符全连接图包括多个字符顶点,以及所述多个字符顶点之间的多个字符连接边;
将所述多个字符输入至空间语言模型之中以形成所述每个字符的空间语义特征;
根据所述多个字符的字符信息生成所述多个字符顶点的顶点类型;
根据所述空间语义特征和所述字符信息生成所述多个字符连接边的边类型;以及
根据所述顶点类型和所述边类型生成所述目标文档的文档布局;
其中,所述空间语言模型通过以下步骤训练得到:
获取样本文档之中的多个样本字符以及所述多个样本字符的样本字符信息;
根据所述多个样本字符以及所述样本字符信息生成样本字符全连接图;
将所述样本字符全连接图之中的部分样本字符进行遮掩,并将遮掩之后的样本字符全连接图输入至所述空间语言模型进行预测以生成被遮掩位置的预测字符;以及
根据所述遮掩位置的样本字符与所述预测字符对所述空间语言模型进行训练。
2.如权利要求1所述的文档布局的解析方法,所述根据所述空间语义特征和所述字符信息生成所述多个字符连接边的边类型,包括:
将所述多个字符的空间语义特征和字符信息输入至边类型识别模型以生成所述多个字符连接边的边类型。
3.如权利要求2所述的文档布局的解析方法,所述边类型识别模型通过以下步骤训练得到:
获取样本文档之中的多个样本字符以及所述多个样本字符的样本字符信息;
根据所述多个样本字符以及所述样本字符信息生成样本字符全连接图;
获取每个所述样本字符的样本空间语义特征;
将所述样本字符全连接图之中的部分样本字符连接边进行遮掩,并将遮掩之后的样本字符全连接图以及所述样本空间语义特征输入至所述边类型识别模型进行预测以生成被遮掩位置的预测边类型;以及
根据所述遮掩位置的样本字符连接边类型与所述预测边类型对所述边类型识别模型进行训练。
4.如权利要求1所述的文档布局的解析方法,所述获取目标文档之中的多个字符,包括:
将所述目标文档输入字符检测模型以获取所述目标文档之中的所述多个字符。
5.如权利要求4所述的文档布局的解析方法,所述字符检测模型通过以下步骤训练得到:
获取样本文档之中的多个样本字符以及所述多个样本字符的样本字符信息;
根据所述多个样本字符以及所述样本字符信息生成样本字符全连接图;
对所述样本字符全连接图之中多个字符顶点之中的部分字符顶点添加随机扰动;
将添加随机扰动之后的所述样本字符全连接图输入所述字符检测模型进行字符预测以生成预测字符;以及
根据所述预测字符与所述样本文档之中的样本字符对所述字符检测模型进行训练。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京百度网讯科技有限公司,未经北京百度网讯科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010484261.0/1.html,转载请声明来源钻瓜专利网。