[发明专利]基于布局关联性的视觉富文档信息抽取方法、系统及介质在审

申请号：	202210223134.4	申请日：	2022-03-07
公开（公告）号：	CN114782965A	公开（公告）日：	2022-07-22
发明（设计）人：	唐国志;薛洋;金连文	申请（专利权）人：	华南理工大学
主分类号：	G06V30/40	分类号：	G06V30/40;G06V30/418;G06N3/08;G06K9/62;G06F40/30;G06V10/764;G06V30/42
代理公司：	广州嘉权专利商标事务所有限公司 44205	代理人：	郑宏谋
地址：	510641 广***	国省代码：	广东;44
权利要求书：	查看更多	说明书：	查看更多
摘要：
搜索关键词：	基于布局关联性视觉文档信息抽取方法系统介质
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【权利要求书】：

1.一种基于布局关联性的视觉富文档信息抽取方法，其特征在于，包括以下步骤：

获取视觉富文档图像，并对视觉富文档图像进行标注，获得数据集；

构建针对布局关联性的文档信息抽取模型，采用数据集对文档信息抽取模型进行训练；

获取视觉富文档图片，将视觉富文档图片输入训练后的文档信息抽取模型，获得信息抽取结果；

其中，布局关联性指的是静态字段和动态字段之间的位置关系，静态字段为同一模板中文字固定的字段，动态字段为同一模板中根据实际内容变化的字段。

2.根据权利要求1所述的一种基于布局关联性的视觉富文档信息抽取方法，其特征在于，

所述文档信息抽取模型的训练过程，包括：

将字段中不同的语义表示为一个1024维的嵌入向量，将字段的位置特征量化为数字，将处理好的语义和位置特征输入作为输入特征；

对预设模型中每个类别计算这个类别里面所有输入特征的均值，作为每个类别的类别中心；

通过衡量样本与类别中心的距离来完成分类。

3.根据权利要求1所述的一种基于布局关联性的视觉富文档信息抽取方法，其特征在于，

所述文档信息抽取模型对输入的视觉富文档图片进行如下处理：

获取视觉富文档图片中每个独立的字段，作为图中的节点；

获取节点之间的边连接关系；其中，边连接关系为{|X_i-j|，|Y_i-j|，W_i/W_j，H_i/H_j}，|X_i-j|表示两个字段节点在横坐标上的距离，|Y_i-j|表示两个字段节点在纵坐标上的距离，W_i/W_j表示两个字段节点对应的两个矩形框的宽的比值，H_i/H_j表示两个字段节点对应的两个矩形框的高的比值；