[发明专利]页面元素的识别方法、装置、电子设备及存储介质在审
申请号: | 202110442292.4 | 申请日: | 2021-04-23 |
公开(公告)号: | CN113128604A | 公开(公告)日: | 2021-07-16 |
发明(设计)人: | 王绎超 | 申请(专利权)人: | 北京奇艺世纪科技有限公司 |
主分类号: | G06K9/62 | 分类号: | G06K9/62;G06T7/73;G06K9/46;G06N3/04;G06N3/08;G06T7/11;G06T7/136;G06T7/194 |
代理公司: | 北京柏杉松知识产权代理事务所(普通合伙) 11413 | 代理人: | 项京;丁芸 |
地址: | 100080 北京市海淀区*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 页面 元素 识别 方法 装置 电子设备 存储 介质 | ||
本发明实施例提供了一种页面元素的识别方法、装置、电子设备及存储介质,其中页面元素的识别方法包括:获取待处理页面,待处理页面为包含至少一个目标元素信息的页面图;基于预先训练好的图像识别模型,对待处理页面进行元素识别,获得识别结果,识别结果中包含目标元素的位置及类别。本发明实施例能够实现图像中各组件元素的智能识别。
技术领域
本发明涉及页面处理技术领域,特别是涉及一种页面元素的识别方法、装置、电子设备及存储介质。
背景技术
在视频APP(Application,应用程序)的开发过程中,通常需要先提供UI(UserInterface,用户界面)设计图,接着由研发人员对UI设计图进行识别,识别其中的区块、图片、角标、文本、以及按钮等组件元素,再利用这些组件元素生成区块模板,经过后端代码处理后将组装好的模板数据返回给APP端,由APP端完成页面的渲染,即可将页面展示给用户。
现有技术中,通常采用人工识别的方法识别UI设计图中的区块、图片、角标、文本以及按钮等组件元素,识别效率较低,也就是说,现有技术无法实现UI设计图中各组件元素的智能识别。
发明内容
本发明实施例的目的在于提供一种页面元素的识别方法、装置、电子设备及存储介质,以实现页面中各组件元素的智能识别。具体技术方案如下:
本发明实施例的第一方面,提供一种页面元素的识别方法,所述方法包括:
获取待处理页面,所述待处理页面为包含至少一个目标元素的页面图;
基于预先训练好的图像识别模型,对所述待处理页面进行元素识别,获得识别结果,所述识别结果中包含目标元素的位置及类别。
可选地,所述识别结果中还包含:所述目标元素的尺寸信息;
所述方法还包括:
基于各所述目标元素的位置、类别及所述尺寸信息,生成页面模板结构,所述页面模板结构中包括各所述目标元素,以及各所述目标元素的排列顺序;
基于所述页面模板结构,以及预设的数据标识,生成页面模板,所述数据标识为预先确定的用于生成页面的数据的标识。
可选地,所述基于预先训练好的图像识别模型,对所述待处理页面进行元素识别,获得识别结果的步骤,包括:
利用所述图像识别模型中的特征提取子模型,对所述待处理页面进行特征提取,获得特征图;
利用所述图像识别模型中的区域生成子模型,获得所述特征图中的多个预测区域,及各所述预测区域对应的目标得分;
利用所述图像识别模型中的区域筛选子模型,各所述预测区域的目标得分,及各所述预测区域在所述待处理页面中的位置,从所述多个预测区域筛选出多个目标区域,所述目标区域的数量少于所述预测区域的数量;
利用所述图像识别模型中的区域识别子模型,以及所述特征图,获得各所述目标区域的类别。
可选地,所述利用所述图像识别模型中的区域生成子模型,获得所述特征图中的多个预测区域,及各所述预测区域对应的目标得分的步骤,包括:
利用所述区域生成子模型,确定所述特征图中的多个锚点中心,及每个所述锚点中心对应的多个锚点区域;
获得每个所述锚点区域对应的预测偏移量及各所述预测偏移量对应的目标得分;所述预测偏移量表示所述锚点区域相对于所述目标元素所预测的偏移量;
利用每个所述锚点区域,及每个所述锚点区域对应的所述多个预测偏移量,获得每个所述锚点区域对应的多个预测区域。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京奇艺世纪科技有限公司,未经北京奇艺世纪科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110442292.4/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种可自动转向式高铁座椅
- 下一篇:一种机械加工用异形零件夹持装置