[发明专利]一种面向移动端设备的障碍物检测方法有效
申请号: | 202010738838.6 | 申请日: | 2020-07-28 |
公开(公告)号: | CN111881828B | 公开(公告)日: | 2022-05-06 |
发明(设计)人: | 王闻箫;蔡登 | 申请(专利权)人: | 浙江大学 |
主分类号: | G06V20/58 | 分类号: | G06V20/58;G06K9/62;G06N3/04;G06N3/08;G06V10/774 |
代理公司: | 杭州天勤知识产权代理有限公司 33224 | 代理人: | 彭剑;胡红娟 |
地址: | 310013 浙江*** | 国省代码: | 浙江;33 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 面向 移动 设备 障碍物 检测 方法 | ||
本发明公开了一种面向移动端设备的障碍物检测方法,包括:(1)选择障碍物检测模型;(2)将训练完的检测模型的识别准确率a作为因变量,模型的深度d、宽度w和图片大小r作为自变量;(3)分别对模型的深度d、宽度w和图片大小r进行剪枝,并在数据集上对模型进行微调,用函数f拟合a与d、w、r之间的关系;(4)通过优化函数求解最优的深度、宽度和图片大小(dm,wm,rm),并根据求得的(dm,wm,rm),导出对应的精简模型结构;(5)在数据集上对精简模型进行训练;(6)在移动端设备运行精简模型,实时输入周围的环境照片,进行障碍物识别。本发明使深度卷积神经网络可以满足移动端设备的流畅性要求,同时使障碍物检测具有较高的准确率。
技术领域
本发明属于计算机视觉技术领域,尤其是涉及一种面向移动端设备的障碍物检测方法。
背景技术
随着计算机视觉技术的发展,图像识别、目标检测等技术被广泛应用于自动驾驶、门禁系统等领域。而深度卷积神经网络是计算机视觉领域最重要深度学习框架之一,它由多个卷积层和全连接层组成的,目前准确率最高的图像识别、目标检测等算法,都使用了深度卷积神经网络。然而,深度卷积神经网络的运行需要消耗大量的计算资源,而大部分移动设备(例如手机、车载芯片等)的计算资源都非常有限,这严重阻碍了深度卷积神经网络在移动端的部署,因此,对深度卷积神经网络进行加速是必不可少的。
对深度卷积神经网络(下称模型)进行加速的基本思路就是减小模型推理过程中的浮点运算量,同时尽量保证模型的准确率损失最小。通常来说,有三种手段:1)减小模型的深度;2)减小模型的宽度;3)减小模型使用的图片尺寸大小。(注:深度指模型的层数,层数越多则越深;宽度指模型每层的过滤器数量,数量越多则越宽)。
大多数以往的神经网络加速系统都只专注于其中一种加速手段,以2)为例,他们认为同一层内不同的过滤器的重要程度是不一样的,因此着重研究在减小模型的宽度时应该删除哪些过滤器才能对模型准确率影响最小。但是,在实际使用中发现,给定一个计算量,单纯的减小宽度、深度或图片大小都会使模型准确率下降很大。相反,如果能够同时减小这三者的大小,找到一个最优的组合策略,则可以把模型准确率损失降到最小,但是如何才能找到最优的三者的组合是一个很难解决的问题。
目前已有的技术是通过近似暴力搜索的方式来寻找最优组合的,即将计算量满足要求的可能的深度、宽度、图片大小都训练一个新的模型,并选择出准确率最高的一个,但是这种方法十分耗时。
发明内容
本发明提供了一种面向移动端设备的障碍物检测方法,使深度卷积神经网络可以满足移动端设备的流畅性要求,同时使障碍物检测具有较高的准确率。
一种面向移动端设备的障碍物检测方法,包括:
(1)选择障碍物检测模型,并在数据集中进行训练;
(2)将训练完的检测模型的识别准确率a作为因变量,模型的深度d、模型的宽度w和图片的大小r作为自变量;
(3)分别对模型的深度d、模型的宽度w和图片的大小r进行剪枝,并在数据集上对模型进行微调,用函数f(d,w,r)拟合识别准确率a与深度d、宽度w和图片的大小r之间的关系;
(4)通过优化函数求解最优的深度、宽度和图片大小(dm,wm,rm),并根据求得的(dm,wm,rm),导出对应的精简模型结构;
(5)在数据集上对精简模型进行训练直到模型收敛;
(6)在移动端设备运行精简模型,实时输入周围的环境照片,进行障碍物识别。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于浙江大学,未经浙江大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010738838.6/2.html,转载请声明来源钻瓜专利网。