[发明专利]图像识别的方法和装置有效
申请号: | 201910846856.3 | 申请日: | 2019-09-09 |
公开(公告)号: | CN110705564B | 公开(公告)日: | 2023-04-18 |
发明(设计)人: | 谢念;王靓伟 | 申请(专利权)人: | 华为技术有限公司 |
主分类号: | G06V10/44 | 分类号: | G06V10/44;G06V10/774 |
代理公司: | 北京龙双利达知识产权代理有限公司 11329 | 代理人: | 王雷;时林 |
地址: | 518129 广东*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 图像 识别 方法 装置 | ||
本申请提供了图像识别的方法和装置。涉及人工智能领域,具体涉及计算机视觉领域。该方法包括:获取至少两个物体的第一图像;获取位置信息,位置信息指示所述至少两个物体中的第一物体和第二物体在第一图像中的位置;使用第一模型和位置信息对第一图像进行处理,以获取第一物体和第二物体的物体特征;获取第一图像的边缘信息;根据边缘信息、物体特征,使用第二模型识别所述第一物体和所述第二物体的连接状态。根据图像中的边缘信息和物体的特征,能够确定物体的连接状态。
技术领域
本申请涉及计算机视觉领域,尤其涉及一种图像识别的方法及装置。
背景技术
计算机视觉是各个应用领域,如制造业、检验、文档分析、医疗诊断,和军事等领域中各种智能/自主系统中不可分割的一部分,它是一门关于如何运用照相机/摄像机和计算机来获取我们所需的,被拍摄对象的数据与信息的学问。形象地说,就是给计算机安装上眼睛(照相机/摄像机)和大脑(算法)用来代替人眼对目标进行识别、跟踪和测量等,从而使计算机能够感知环境。因为感知可以看作是从感官信号中提取信息,所以计算机视觉也可以看作是研究如何使人工系统从图像或多维数据中“感知”的科学。总的来说,计算机视觉就是用各种成象系统代替视觉器官获取输入信息,再由计算机来代替大脑对这些输入信息完成处理和解释。计算机视觉的最终研究目标就是使计算机能像人那样通过视觉观察和理解世界,具有自主适应环境的能力。
对于需要识别物体之间连接状态的场景,一种实现工业视觉的方式是通过手工设计的特征模板对设备、零件进行识别,并检测相互关系。为了确定连线关系,将连线信息添加到特征向量中。连线信息例如包括与设备相连的连线的颜色、粗细、材质、走向等。识别设备、零件等物体和连线后,提取物体和连线与连接关系有关的特征,从而确定两物体之间是否将连接。由于手工设计的特征缺乏泛化能力,针对不同场景需要手工设计对应的模板,工作冗余严重,效率低。
发明内容
本申请提供一种图像识别的方法和装置,能够确定图像中的物体是否连接。
第一方面,提供一种图像识别的方法,包括:获取第一图像,所述第一图像包括至少两个物体;获取位置信息,所述位置信息用于指示所述至少两个物体中的第一物体和第二物体在所述第一图像中的位置;使用第一模型和所述位置信息对所述第一图像进行处理,以获取所述第一物体和所述第二物体的物体特征;获取所述第一图像的边缘信息;根据所述边缘信息、所述物体特征,使用第二模型识别所述第一物体和所述第二物体的连接状态。
从第一图像中得到至少两个物体的特征后,通过图像中的边缘信息,能够确定两个物体是否连接。避免了对于连接部件的识别,可以适用于更多的场景,能够在物体之间连接部件的不同的情况下对物体的连接状态进行识别,效率高。
结合第一方面,在一些可能的实现方式中,所述方法还包括:使用第三模型对所述第一图像进行处理,以获取所述位置信息。
通过第一图像获取位置信息,不需要额外获取位置信息,减少对于输入数据的依赖性。获取数据较多,获取数据出现错误的概率增加,另外,数据传输过程中可能出现错误,因此,通过该方式能够减小由于获取的数据错误导致的图像识别错误。
结合第一方面,在一种可能的实现方式中,所述方法还包括:获取第一训练图像和第一指示信息,所述第一训练图像包括至少两个物体,所述第一指示信息用于指示所述第一训练图像中的物体在所述第一训练图像中的第一位置;使用第一原始模型对所述第一训练图像处理,以获取第二指示信息,所述第二指示信息用于指示经过所述第一原始模型识别的所述第一训练图像中的物体在所述第一训练图像中的第二位置;根据所述第二指示信息和所述第一指示信息调整所述第一原始模型的参数,以使所述第一位置和所述第二位置的相似度在第一预设范围内;将经过调整后的第一原始模型,作为所述第三模型。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于华为技术有限公司,未经华为技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910846856.3/2.html,转载请声明来源钻瓜专利网。
- 彩色图像和单色图像的图像处理
- 图像编码/图像解码方法以及图像编码/图像解码装置
- 图像处理装置、图像形成装置、图像读取装置、图像处理方法
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序以及图像解码程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序、以及图像解码程序
- 图像形成设备、图像形成系统和图像形成方法
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序