[发明专利]页面元素的识别方法、装置、电子设备及存储介质在审
申请号: | 202110442292.4 | 申请日: | 2021-04-23 |
公开(公告)号: | CN113128604A | 公开(公告)日: | 2021-07-16 |
发明(设计)人: | 王绎超 | 申请(专利权)人: | 北京奇艺世纪科技有限公司 |
主分类号: | G06K9/62 | 分类号: | G06K9/62;G06T7/73;G06K9/46;G06N3/04;G06N3/08;G06T7/11;G06T7/136;G06T7/194 |
代理公司: | 北京柏杉松知识产权代理事务所(普通合伙) 11413 | 代理人: | 项京;丁芸 |
地址: | 100080 北京市海淀区*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 页面 元素 识别 方法 装置 电子设备 存储 介质 | ||
1.一种页面元素的识别方法,其特征在于,所述方法包括:
获取待处理页面,所述待处理页面为包含至少一个目标元素的页面图;
基于预先训练好的图像识别模型,对所述待处理页面进行元素识别,获得识别结果,所述识别结果中包含目标元素的位置及类别。
2.根据权利要求1所述的方法,其特征在于,所述识别结果中还包含:所述目标元素的尺寸信息;
所述方法还包括:
基于各所述目标元素的位置、类别及所述尺寸信息,生成页面模板结构,所述页面模板结构中包括各所述目标元素,以及各所述目标元素的排列顺序;
基于所述页面模板结构,以及预设的数据标识,生成页面模板,所述数据标识为预先确定的用于生成页面的数据的标识。
3.根据权利要求1所述的方法,其特征在于,所述基于预先训练好的图像识别模型,对所述待处理页面进行元素识别,获得识别结果的步骤,包括:
利用所述图像识别模型中的特征提取子模型,对所述待处理页面进行特征提取,获得特征图;
利用所述图像识别模型中的区域生成子模型,获得所述特征图中的多个预测区域,及各所述预测区域对应的目标得分;
利用所述图像识别模型中的区域筛选子模型,各所述预测区域的目标得分,及各所述预测区域在所述待处理页面中的位置,从所述多个预测区域筛选出多个目标区域,所述目标区域的数量少于所述预测区域的数量;
利用所述图像识别模型中的区域识别子模型,以及所述特征图,获得各所述目标区域的类别。
4.根据权利要求3所述的方法,其特征在于,所述利用所述图像识别模型中的区域生成子模型,获得所述特征图中的多个预测区域,及各所述预测区域对应的目标得分的步骤,包括:
利用所述区域生成子模型,确定所述特征图中的多个锚点中心,及每个所述锚点中心对应的多个锚点区域;
获得每个所述锚点区域对应的预测偏移量及各所述预测偏移量对应的目标得分;所述预测偏移量表示所述锚点区域相对于所述目标元素所预测的偏移量;
利用每个所述锚点区域,及每个所述锚点区域对应的所述多个预测偏移量,获得每个所述锚点区域对应的多个预测区域。
5.根据权利要求3所述的方法,其特征在于,所述利用所述图像识别模型中的区域筛选子模型,各所述预测区域的目标得分,及各所述预测区域在所述待处理页面中的位置,从所述多个预测区域筛选出多个目标区域的步骤,包括:
将各所述预测区域映射至所述待处理页面中;
将超出所述待处理页面边缘的所述预测区域删除;
针对每个锚点中心对应的经删除后剩余的预测区域,将最大目标得分对应的预测区域确定为该锚点中心对应的目标区域。
6.根据权利要求3所述的方法,其特征在于,所述利用所述图像识别模型中的区域识别子模型,以及所述特征图,获得各所述目标区域的类别的步骤,包括:
将各所述目标区域映射至所述特征图,获得各所述目标区域对应的区域特征图;
针对各所述区域特征图,将该区域特征图划分为多个子区域特征图,并对所述多个子区域特征图中的特征点进行整合处理,获得经整合后的区域特征图;
对各所述经整合后的区域特征图进行识别,获得各所述目标区域对应的类别。
7.一种页面元素的识别装置,其特征在于,所述装置包括:
页面获取模块,用于获取待处理页面,所述待处理页面为包含至少一个目标元素的页面图;
识别结果获得模块,用于基于预先训练好的图像识别模型,对所述待处理页面进行元素识别,获得识别结果,所述识别结果中包含:目标元素的位置及类别。
8.一种电子设备,其特征在于,包括处理器、通信接口、存储器和通信总线,其中,处理器,通信接口,存储器通过通信总线完成相互间的通信;
存储器,用于存放计算机程序;
处理器,用于执行存储器上所存放的程序时,实现权利要求1-6任一所述的方法步骤。
9.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质内存储有计算机程序,所述计算机程序被处理器执行时实现权利要求1-6任一所述的方法步骤。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京奇艺世纪科技有限公司,未经北京奇艺世纪科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110442292.4/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种可自动转向式高铁座椅
- 下一篇:一种机械加工用异形零件夹持装置