[发明专利]图像处理方法、装置、计算机设备以及存储介质在审
申请号: | 202111232728.3 | 申请日: | 2021-10-22 |
公开(公告)号: | CN114328679A | 公开(公告)日: | 2022-04-12 |
发明(设计)人: | 曹浩宇;包志敏;王斌;刘银松;姜德强 | 申请(专利权)人: | 腾讯科技(深圳)有限公司 |
主分类号: | G06F16/25 | 分类号: | G06F16/25;G06F16/28 |
代理公司: | 广州三环专利商标代理有限公司 44202 | 代理人: | 熊永强;杜维 |
地址: | 518057 广东省深圳*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 图像 处理 方法 装置 计算机 设备 以及 存储 介质 | ||
1.一种图像处理方法,其特征在于,包括:
获取待识别图像,对所述待识别图像进行字符识别处理,得到识别结果;其中,所述识别结果包括识别到的数据序列,所述数据序列包括字符序列、图像序列和位置序列中的一个或多个,所述字符序列是所述待识别图像中的字符组成的序列,所述图像序列是所述字符序列中的每个字符在所述待识别图像中的切片组成的序列,所述位置序列是所述字符序列中的每个字符在所述待识别图像中的位置组成序列;
基于所述数据序列的多模态特征序列对所述数据序列进行序列标注处理,得到所述数据序列中每个数据的结构化类别;
根据所述数据序列和所述数据序列中每个数据的结构化类别,创建与所述待识别图像对应的结构化文档。
2.根据权利要求1所述的方法,其特征在于,当所述数据序列包括字符序列、图像序列和位置序列中的多个时,所述基于所述数据序列的多模态特征序列对所述数据序列进行序列标注处理,得到所述数据序列中每个数据的结构化类别,包括:
将所述数据序列包含的多个序列分别转为特征序列,并将多个特征序列对位拼接为所述数据序列的多模态特征序列;
调用多模态特征提取模型对所述多模态特征序列进行编码,得到多模态结构化特征序列;
调用结构化类别识别模型对所述多模态结构化特征序列进行解码,得到所述数据序列中每个数据的结构化类别。
3.根据权利要求2所述的方法,其特征在于,所述多模态特征提取模型是基于预训练任务所训练的特征提取模型,所述预训练任务包括替换任务、匹配任务和分类任务中的一个或多个;
所述替换任务是对第一模态样本序列进行数据替换处理,并根据第二模态样本序列预测处理后的第一模态样本序列中每个样本的替换结果,所述第一模态样本序列和所述第二模态样本序列是样本图像序列、样本字符序列和样本位置序列中的两个不同序列,所述样本字符序列是第一模态样本序列或第二模态样本序列;
所述匹配任务是预测样本图像子序列和样本字符子序列之间的上下文关系,所述样本图像子序列是所述样本图像序列的子序列,所述样本字符子序列是所述样本字符序列的子序列;
所述分类任务是预测所述样本字符序列的文档类别,所述样本图像序列、所述样本字符序列和所述样本位置序列之间均具有对应关系。
4.根据权利要求3所述的方法,其特征在于,所述方法还包括:
获取第一模态样本序列和第二模态样本序列,对所述第一模态样本序列进行替换处理,得到替换样本序列;
将所述替换样本序列转换为替换特征序列,以及将所述第二模态样本序列转换为第二模态样本特征序列,将所述替换特征序列和所述第二模态样本特征序列对位拼接为第一样本多模态特征序列;
调用所述多模态特征提取模型对所述第一样本多模态特征序列进行编码,得到第一样本结构化特征序列;
调用替换判别模型对所述第一样本结构化特征序列进行解码,得到预测替换结果序列;
获取所述替换样本序列的替换结果标签序列,根据所述替换结果标签序列和所述预测替换结果序列训练所述多模态特征提取模型。
5.根据权利要求3所述的方法,其特征在于,所述方法还包括:
获取样本图像序列,从所述样本图像序列中抽取样本图像子序列;
获取样本字符序列,从所述样本字符序列中抽取样本字符子序列;
将所述样本图像子序列转为样本图像特征子序列,并将所述样本字符子序列的样本字符特征子序列,将所述样本图像特征子序列和所述样本字符特征子序列对位拼接为第二样本多模态特征序列;
调用所述多模态特征提取模型对所述第二样本多模态特征序列进行编码,得到第二样本结构化特征序列;
调用关系判别模型对所述第二样本结构化特征序列进行解码,得到预测上下文关系;
获取所述样本图像子序列和所述样本字符子序列之间的上下文关系标签,根据所述预测上下文关系和所述上下文关系标签训练所述多模态特征提取模型。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于腾讯科技(深圳)有限公司,未经腾讯科技(深圳)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202111232728.3/1.html,转载请声明来源钻瓜专利网。
- 彩色图像和单色图像的图像处理
- 图像编码/图像解码方法以及图像编码/图像解码装置
- 图像处理装置、图像形成装置、图像读取装置、图像处理方法
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序以及图像解码程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序、以及图像解码程序
- 图像形成设备、图像形成系统和图像形成方法
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序