[发明专利]物体识别方法及装置在审
申请号: | 201910493331.6 | 申请日: | 2019-06-06 |
公开(公告)号: | CN110298262A | 公开(公告)日: | 2019-10-01 |
发明(设计)人: | 江立辉;屈展;张维 | 申请(专利权)人: | 华为技术有限公司 |
主分类号: | G06K9/00 | 分类号: | G06K9/00;G06N3/04;G06N3/08 |
代理公司: | 暂无信息 | 代理人: | 暂无信息 |
地址: | 518129 广东*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 主干网络 并行 置信度 特征图 输出 感知 检测 计算机视觉领域 人工智能领域 接收输入 卷积处理 所在区域 网络包括 物体识别 分辨率 图片 概率 申请 网络 | ||
本申请涉及人工智能领域。具体涉及计算机视觉领域,公开了一种基于多个Header的感知网络,所述感知网络包括主干网络和多个并行Header,所述多个并行Header和所述主干网络连接;所述主干网络,用于接收输入的图片,并对所述输入的图片进行卷积处理,输出对应所述图片的具有不同分辨率的特征图;所述多个并行Header中的每个Header,用于根据所述主干网络输出的特征图,对一个任务中的任务物体进行检测,输出所述任务物体所在区域的2D框以及每个2D框对应的置信度;其中,所述每个并行Header完成不同的任务物体的检测;其中,所述任务物体为该任务中需要检测的物体;所述置信度越高,表示所述对应该置信度的2D框内存在所述任务所对应的任务物体的概率越大。
技术领域
本申请涉及人工智能领域,尤其涉及一种物体识别方法及装置。
背景技术
计算机视觉是各个应用领域,如制造业、检验、文档分析、医疗诊断,和军事等领域中各种智能/自主系统中不可分割的一部分,它是一门关于如何运用照相机/摄像机和计算机来获取我们所需的,被拍摄对象的数据与信息的学问。形象地说,就是给计算机安装上眼睛(照相机或摄像机)和大脑(算法)用来代替人眼对目标进行识别、跟踪和测量等,从而使计算机能够感知环境。因为感知可以看作是从感官信号中提取信息,所以计算机视觉也可以看作是研究如何使人工系统从图像或多维数据中“感知”的科学。总的来说,计算机视觉就是用各种成象系统代替视觉器官获取输入信息,再由计算机来代替大脑对这些输入信息完成处理和解释。计算机视觉的最终研究目标就是使计算机能像人那样通过视觉观察和理解世界,具有自主适应环境的能力。
目前视觉感知网络能完成的功能越来越多,包括图片分类、2D检测、语义分割(Mask)、关键点检测、线性物体检测(比如自动驾驶技术中的车道线或停止线检测)、可行驶区域检测等。另外,视觉感知系统具有成本低、非接触性、体积小、信息量大的特点。随着视觉感知算法的精度的不断提高,其成为当今众多人工智能系统的关键技术,得到越来越广泛的应用,如:高级驾驶辅助系统(ADAS,Advanced Driving Assistant System)和自动驾驶系统(ADS,Autonomous Driving System)中对路面上的动态障碍物(人或车)、静态物体(交通灯、交通标志或交通锥状物)的识别,在终端视觉的拍照美颜功能中通过识别人体的Mask和关键点实现瘦身效果等。
目前主流的视觉感知网络大多数集中在一种检测任务,如2D检测、3D检测、语义分割、关键点检测等。如果要实现多个功能,则往往需要不同的网络来完成。多个网络同时运行会显著提升硬件的计算量和功耗,降低模型的运行速度,难以实现实时检测。
发明内容
为了减少硬件的计算量和功耗,提升感知网络模型的运算速度,本发明实施例提供一种基于多个头端(Header)的感知网络,所述感知网络包括主干网络和多个并行Header,所述多个并行Header所述和主干网络连接;
所述主干网络,用于接收输入的图片,并对输入的图片进行卷积处理,输出对应所述图片的具有不同分辨率的特征图;
所述一个并行Header,用于根据所述主干网络输出的特征图,对一个任务中的任务物体进行检测,输出所述任务物体所在区域的2D框以及每个2D框对应的置信度;其中,所述每个并行Header完成不同的任务物体的检测;其中,所述任务物体为该任务中需要检测的物体;所述置信度越高,表示所述对应该置信度的2D框内存在所述任务所对应的物体的概率越大。所述一个并Header是上述多个并行Header中的任一个,每个并行header的功能是相似的。
可选地,每个并行头端包括候选区域生成网络(RPN)模块、感兴趣区域提取(ROI-ALIGN)模块和区域卷积神经网络(RCNN)模块,所述一个并行头端的RPN模块独立于其它并行头端的RPN模块;所述一个并行头端的ROI-ALIGN模块独立于其它并行头端的ROI-ALIGN模块;所述一个并行头端的RCNN模块独立于其它并行头端的RCNN模块,其中,对于每一个并行头端:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于华为技术有限公司,未经华为技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910493331.6/2.html,转载请声明来源钻瓜专利网。