[发明专利]样本处理方法、装置、计算机可读介质及电子设备有效

专利信息
申请号: 202110824872.X 申请日: 2021-07-21
公开(公告)号: CN113537368B 公开(公告)日: 2023-06-30
发明(设计)人: 刘昊岳;肖杨;付晓;刘设伟 申请(专利权)人: 泰康保险集团股份有限公司;泰康在线财产保险股份有限公司
主分类号: G06V30/19 分类号: G06V30/19;G06V30/148;G06V30/414;G06V10/82
代理公司: 隆天知识产权代理有限公司 72003 代理人: 郑特强;石海霞
地址: 100031 北*** 国省代码: 北京;11
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 样本 处理 方法 装置 计算机 可读 介质 电子设备
【说明书】:

本公开的实施例提供了一种应用于图像区域规划模型训练的样本处理方法、应用于图像区域规划模型训练的样本处理装置、计算机可读介质及电子设备,涉及图像处理技术领域,该方法包括:识别样本图像中各文本框,并根据各文本框确定样本图像对应的图像特征、语义特征以及预设特征并融合,得到样本图像的综合特征;基于样本图像的综合特征和文本框参数确定每两个文本框之间的关系矩阵;根据各文本框的预设标签、样本图像的综合特征和关系矩阵训练图像区域规划模型。可见,实施本申请的技术方案,可以训练得到能划分出图像中需要进行结构化信息提取的有效区域的图像区域规划模型,基于图像区域规划模型可以提升信息提取效率和精度。

技术领域

本公开涉及图像处理技术领域,具体而言,涉及一种应用于图像区域规划模型训练的样本处理方法、应用于图像区域规划模型训练的样本处理装置、计算机可读介质及电子设备。

背景技术

对于图像中文字的提取,一般需要人为手动将照片中的文字输入标准化的列表,以通过结构化信息的方式统一对照片中文字进行标准化存储。但是,人工提取信息通常会存在效率较低的问题。为了解决这个问题,一些厂商设计出自动化提取图像文本信息的模型,用于基于一个提取标准进行自动化的图像文本信息提取,但是,图像中文字排版一般较为多样,通过统一的提取标准也容易造成提取精度较低的问题。

需要说明的是,在上述背景技术部分公开的信息仅用于加强对本公开的背景的理解,因此可以包括不构成对本领域普通技术人员已知的现有技术的信息。

发明内容

本公开实施例的目的在于提供一种应用于图像区域规划模型训练的样本处理方法、应用于图像区域规划模型训练的样本处理装置、计算机可读介质及电子设备,可以训练得到能划分出图像中需要进行结构化信息提取的有效区域的图像区域规划模型,基于训练出的图像区域规划模型可以提升针对图像的信息提取效率,并提升结构化信息提取精度,降低对于算力的浪费。

可以通过训练图像区域规划模型解决人工输入信息效率较低的问题,实现对于结构化信息的自动提取,提升结构化信息提取效率。

本公开实施例的第一方面提供了一种应用于图像区域规划模型训练的样本处理方法,其中的图像区域规划模型用于规划出图像中包含结构化信息的区域,该方法包括:

识别样本图像中各文本框,并根据各文本框确定样本图像对应的图像特征、语义特征以及预设特征;

将样本图像对应的图像特征、语义特征以及预设特征进行融合,得到样本图像的综合特征;

根据各文本框在样本图像中的位置确定用于表征各文本框之间位置关系的文本框参数,并基于样本图像的综合特征和文本框参数确定每两个文本框之间的关系矩阵;

根据各文本框的预设标签、样本图像的综合特征和每两个文本框之间的关系矩阵训练图像区域规划模型。

根据本公开实施例的第二方面,提供一种应用于图像区域规划模型训练的样本处理装置,其中的图像区域规划模型用于规划出图像中包含结构化信息的区域,该装置包括:

文本框识别单元,用于识别样本图像中各文本框;

特征提取单元,用于根据各文本框确定样本图像对应的图像特征、语义特征以及预设特征;

特征融合单元,用于将样本图像对应的图像特征、语义特征以及预设特征进行融合,得到样本图像的综合特征;

参数确定单元,用于根据各文本框在样本图像中的位置确定用于表征各文本框之间位置关系的文本框参数,并基于样本图像的综合特征和文本框参数确定每两个文本框之间的关系矩阵;

分类器训练单元,用于根据各文本框的预设标签、样本图像的综合特征和每两个文本框之间的关系矩阵训练图像区域规划模型。

在本公开的一种示例性实施例中,上述装置还包括:

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于泰康保险集团股份有限公司;泰康在线财产保险股份有限公司,未经泰康保险集团股份有限公司;泰康在线财产保险股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/202110824872.X/2.html,转载请声明来源钻瓜专利网。

同类专利
专利分类
×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top