[发明专利]前端页面图像中的元素提取方法、装置及电子设备在审
申请号: | 202010384142.8 | 申请日: | 2020-05-09 |
公开(公告)号: | CN111291738A | 公开(公告)日: | 2020-06-16 |
发明(设计)人: | 谢杨易;崔恒斌 | 申请(专利权)人: | 支付宝(杭州)信息技术有限公司 |
主分类号: | G06K9/00 | 分类号: | G06K9/00;G06K9/62;G06F16/958 |
代理公司: | 北京博思佳知识产权代理有限公司 11415 | 代理人: | 周嗣勇 |
地址: | 310000 浙江省杭州市*** | 国省代码: | 浙江;33 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 前端 页面 图像 中的 元素 提取 方法 装置 电子设备 | ||
1.前端页面图像中的元素提取方法,包括:
响应于元素提取指令,将接收的目标前端页面图像的图像数据输入元素检测模型进行计算,得到与所述目标前端页面图像包括的元素对应的元素图像数据;
基于所述元素图像数据确定所述元素的元素类型;
如果所述元素为文本元素,则进一步确定所述文本元素的文字内容数据,并存储所述文字内容数据以完成针对所述目标前端页面图像的元素提取。
2.根据权利要求1所述的方法,还包括:
如果所述元素为图像元素,则存储所述图像元素对应的元素图像数据,并基于存储所述元素图像数据的地址生成相应的下载地址,存储所述下载地址以完成针对所述目标前端页面图像的元素提取。
3.根据权利要求2所述的方法,所述确定所述元素的元素类型,包括:
针对所述元素对应的元素图像数据进行OCR识别,得到与所述元素对应的识别结果;
确定所述识别结果中的包括的识别置信度是否达到预设阈值;
如果是,则确定所述元素的元素类型为文本元素;
如果否,则确定所述元素的元素类型为图像元素。
4.根据权利要求3所述的方法,所述进一步确定所述文本元素的文字内容数据,包括:
获取所述识别结果中包括的文字内容数据;
将获取的所述文字内容数据确定为所述文本元素的文字内容数据。
5.根据权利要求2所述的方法,所述确定所述元素的元素类型,包括:
将所述元素对应的元素图像数据输入预先训练的分类器进行计算,并基于计算结果确定所述元素的元素类型;其中,所述分类器为基于若干被标记了元素类型的元素图像样本进行训练得到的;所述元素类型包括图像元素或文本元素。
6.根据权利要求5所述的方法,所述进一步确定所述文本元素的文字数据,包括:
针对所述元素对应的元素图像数据进行OCR识别,得到文字内容数据;
将所述文字内容数据确定为所述文本元素的文字内容数据。
7.根据权利要求1所述的方法,所述元素检测模型为基于深度神经网络构建的检测模型。
8.前端页面的构建方法,包括:
响应于元素提取指令,将接收的目标前端页面图像的图像数据输入元素检测模型进行计算,得到与所述目标前端页面图像包括的元素对应的元素图像数据;
确定所述元素的元素类型;
如果所述元素为文本元素,则进一步确定所述文本元素的文字内容数据,并存储所述文字内容数据以完成针对所述目标前端页面图像的元素提取;
如果所述元素为图像元素,则存储所述图像元素对应的元素图像数据,并基于存储所述元素图像数据的地址生成相应的下载地址,存储所述下载地址以完成针对所述目标前端页面图像的元素提取;
基于存储的图像元素的下载地址、以及文本元素的文字内容数据,构建与所述目标前端页面图像对应的前端页面。
9.前端页面图像中的元素提取装置,包括:
计算模块,响应于元素提取指令,将接收的目标前端页面图像的图像数据输入元素检测模型进行计算,得到与所述目标前端页面图像包括的元素对应的元素图像数据;
确定模块,基于所述元素图像数据确定所述元素的元素类型;
第一存储模块,如果所述元素为文本元素,则进一步确定所述文本元素的文字内容数据,并存储所述文字内容数据以完成针对所述目标前端页面图像的元素提取。
10.根据权利要求9所述的装置,还包括:
第二存储模块,如果所述元素为图像元素,则存储所述图像元素对应的元素图像数据,并基于存储所述元素图像数据的地址生成相应的下载地址,存储所述下载地址以完成针对所述目标前端页面图像的元素提取。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于支付宝(杭州)信息技术有限公司,未经支付宝(杭州)信息技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010384142.8/1.html,转载请声明来源钻瓜专利网。
- 彩色图像和单色图像的图像处理
- 图像编码/图像解码方法以及图像编码/图像解码装置
- 图像处理装置、图像形成装置、图像读取装置、图像处理方法
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序以及图像解码程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序、以及图像解码程序
- 图像形成设备、图像形成系统和图像形成方法
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序