[发明专利]一种图像识别方法、装置、介质和电子设备在审
申请号: | 201910266596.2 | 申请日: | 2019-04-03 |
公开(公告)号: | CN110059596A | 公开(公告)日: | 2019-07-26 |
发明(设计)人: | 张钊;杨萍;邵珊珊 | 申请(专利权)人: | 北京字节跳动网络技术有限公司 |
主分类号: | G06K9/00 | 分类号: | G06K9/00;G06K9/34;G06K9/62 |
代理公司: | 北京睿驰通程知识产权代理事务所(普通合伙) 11604 | 代理人: | 张文平 |
地址: | 100041 北京市石景山区*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 用户界面区域 图像 用户界面信息 电子设备 图像识别 潜在的 输入终端设备 层次分割 技术识别 类别信息 图像提取 学习训练 直线特征 跨平台 截屏 手机 分割 图片 | ||
本公开提供了一种图像识别方法、装置、介质和电子设备,所述方法包括:获取待识别图像;对所述图像进行层次分割;对分割后的所述图像进行直线特征的识别,确定潜在的用户界面区域;以及对所述潜在的用户界面区域进行训练识别,从而确定精确的用户界面信息。通过本公开的图像提取技术识别跨平台图片中的用户界面信息,输入终端设备(例如手机)的截屏图像,能够准确的识别图像中的用户界面区域的位置信息,并且通过深度学习训练能够有针对性的得到用户界面区域的类别信息。
技术领域
本发明涉及计算机技术领域,具体而言,涉及一种图像识别的方法、装置、介质和电子设备,具体涉及一种用户界面的识别方法、装置、介质和电子设备。
背景技术
随着移动互联网技术的发展,尤其移动互联网的发展,涉及图像处理和识别越来越智能化,人们越来越习惯于在移动互联网中进行各种操作,用户操作界面(UserInterface,下文简称UI)是用户操作的可视化平台,可以让软件变得有个性有品味,还要让软件的操作变得舒适、简单、自由,充分体现软件的定位和特点。界面设计不是单纯的美术绘画,他需要定位使用者、使用环境、使用方式并且为最终用户而设计,是纯粹的科学性的艺术设计。检验一个界面的标准既不是某个项目开发组领导的意见也不是项目成员投票的结果,而是最终用户的感受。所以界面设计要和用户研究紧密结合,是一个不断为最终用户设计满意视觉效果的过程。
检验一个图形是否是UI设计,通常可针对图形进行特征化识别,在图形中识别出相应的UI区域,而某些UI提取技术存在无法跨平台高效使用的缺点,对于图像识别技术来说无法找到相应的UI区域。
因此,在长期的研发当中,发明人对图形中UI区域的识别技术的研究,提出了一种对图像识别的方法,以解决上述技术问题之一。
发明内容
针对某些图像提取技术存在无法跨平台高效使用的缺点,考虑到终端设备(例如手机)都有其截屏功能,相对来说可以避免出现无法跨平台的情况发生,所以本方案的输入对象采用的是终端设备的截屏图片。为了UI区域位置提取的更准确,本方案从两个方面入手,截屏图片输入以后,要经过两步确定UI区域位置。本发明的目的在于提供一种图像识别的方法、装置、介质和电子设备,能够解决上述提到的至少一个技术问题。
本公开实施例具体提供了一种图像识别的方法,其中包括:
获取待识别图像;
对所述图像进行层次分割;
对分割后的所述图像进行直线特征的识别,确定潜在的用户界面区域;以及
对所述潜在的用户界面区域进行训练识别,从而确定精确的用户界面信息。
进一步的,所述待识别图像为跨平台图像。
进一步的,所述跨平台图像为手机截屏图像或电脑截屏图像。
进一步的,所述对所述图像进行层次分割,采用灰度阈值分割法或高低频图像分割法。
进一步的,所述对分割后的所述图像进行直线特征的识别,确定潜在的用户界面区域,包括:
采用直线段检测分割算法进行识别;
识别出多个直线段形成直线特征的集合;
所述直线特征的集合中的直线特征构成矩形时,则认定该区域为潜在的用户界面区域。
进一步的,所述对所述潜在的用户界面区域进行训练识别,从而确定精确的用户界面信息,包括:
将所述潜在的用户界面区域与训练识别模块中的类别模型进行对比,得到相应类别的对比相似度;
对比相似度大于类别相似度阈值,则确定该区域为精确的用户界面区域。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京字节跳动网络技术有限公司,未经北京字节跳动网络技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910266596.2/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种用于图像识别的自适应算法
- 下一篇:基于深度相机的场景识别方法
- 彩色图像和单色图像的图像处理
- 图像编码/图像解码方法以及图像编码/图像解码装置
- 图像处理装置、图像形成装置、图像读取装置、图像处理方法
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序以及图像解码程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序、以及图像解码程序
- 图像形成设备、图像形成系统和图像形成方法
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序