[发明专利]一种图像识别方法、装置、介质和电子设备在审
申请号: | 201910266596.2 | 申请日: | 2019-04-03 |
公开(公告)号: | CN110059596A | 公开(公告)日: | 2019-07-26 |
发明(设计)人: | 张钊;杨萍;邵珊珊 | 申请(专利权)人: | 北京字节跳动网络技术有限公司 |
主分类号: | G06K9/00 | 分类号: | G06K9/00;G06K9/34;G06K9/62 |
代理公司: | 北京睿驰通程知识产权代理事务所(普通合伙) 11604 | 代理人: | 张文平 |
地址: | 100041 北京市石景山区*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 用户界面区域 图像 用户界面信息 电子设备 图像识别 潜在的 输入终端设备 层次分割 技术识别 类别信息 图像提取 学习训练 直线特征 跨平台 截屏 手机 分割 图片 | ||
1.一种图像识别方法,其特征在于,包括:
获取待识别图像,所述待识别图像包括用户界面区域,所述用户界面区域包括用户界面区域位置和类别信息;
对所述图像进行层次分割;
对分割后的所述图像进行直线特征的识别,确定潜在的用户界面区域;以及
对所述潜在的用户界面区域进行训练识别,从而确定精确的用户界面区域;
所述对所述潜在的用户界面区域进行训练识别,从而确定精确的用户界面,包括:
将所述潜在的用户界面区域中的类别信息与训练识别模块中的类别模型进行对比,得到相应类别的对比相似度;
对比相似度大于类别相似度阈值,则确定该区域为精确的用户界面区域。
2.根据权利要求1所述的方法,其特征在于,
所述待识别图像为跨平台图像。
3.根据权利要求2所述的方法,其特征在于,
所述跨平台图像为手机截屏图像或电脑截屏图像。
4.根据权利要求1所述的方法,其特征在于,其中所述对所述图像进行层次分割,采用灰度阈值分割法或高低频图像分割法。
5.根据权利要求1所述的方法,其特征在于,所述对分割后的所述图像进行直线特征的识别,确定潜在的用户界面区域,包括:
采用直线段检测分割算法进行识别;
识别出多个直线段形成直线特征的集合;
所述直线特征的集合中的直线特征构成矩形时,则认定该区域为潜在的用户界面区域。
6.一种图像识别方法,其特征在于,包括:
获取待识别图像;所述待识别图像包括用户界面区域,所述用户界面区域包括用户界面区域位置和类别信息;
对所述图像进行层次分割;
对分割后的所述图像进行直线特征的识别,确定第一潜在用户界面区域;
对所述图像进行训练识别,确定第二潜在用户界面区域;
所述对所述图像进行训练识别,确定第二潜在用户界面区域,包括:
将所述类别信息与训练识别模块中的类别模型进行对比;
得到对比相似度大于类别相似度阈值的区域,确定该区域为第二潜在用户界面区域;以及
对比分析所述第一潜在用户界面区域和所述第二潜在用户界面区域,从而确定精确的用户界面区域。
7.根据权利要求6所述的方法,其特征在于,所述对分割后的所述图像进行直线特征的识别,确定第一潜在用户界面区域,包括:
采用直线段检测分割算法进行识别;
识别出多个直线段形成直线特征的集合;
所述直线特征的集合中的直线特征构成矩形时,则认定该区域为第一潜在用户界面区域。
8.根据权利要求7所述的方法,其特征在于,所述对比分析所述第一潜在用户界面区域和所述第二潜在用户界面区域,从而确定精确的用户界面信息,包括:
对比分析所述第一潜在用户界面区域和所述第二潜在用户界面区域;
判断该两个潜在用户界面区域是否相同,如果相同,则确定该区域为用户界面区域。
9.一种图像识别装置,其特征在于,包括:
获取单元,用于获取待识别图像;所述待识别图像包括用户界面区域,所述用户界面区域包括用户界面区域位置和类别信息;
分割单元,用于对所述图像进行层次分割;
线段检测单元,用于对分割后的所述图像进行直线特征的识别,确定潜在的用户界面区域;
训练识别单元,用于对所述潜在的用户界面区域进行训练识别,从而确定精确的用户界面,包括:将所述潜在的用户界面区域中的类别信息与训练识别模块中的类别模型进行对比,得到相应类别的对比相似度;对比相似度大于类别相似度阈值,则确定该区域为精确的用户界面区域。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京字节跳动网络技术有限公司,未经北京字节跳动网络技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910266596.2/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种用于图像识别的自适应算法
- 下一篇:基于深度相机的场景识别方法
- 彩色图像和单色图像的图像处理
- 图像编码/图像解码方法以及图像编码/图像解码装置
- 图像处理装置、图像形成装置、图像读取装置、图像处理方法
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序以及图像解码程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序、以及图像解码程序
- 图像形成设备、图像形成系统和图像形成方法
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序