[发明专利]一种多个小目标的自动准确检测方法在审

申请号：	202010407732.8	申请日：	2020-05-14
公开（公告）号：	CN111738070A	公开（公告）日：	2020-10-02
发明（设计）人：	黄翰;黄黎龙;李刚;徐杨;郝志峰	申请（专利权）人：	华南理工大学
主分类号：	G06K9/00	分类号：	G06K9/00;G06N3/04;G06N3/08
代理公司：	广州市华学知识产权代理有限公司 44245	代理人：	王东东
地址：	510640 广***	国省代码：	广东;44
权利要求书：	查看更多	说明书：	查看更多
摘要：
搜索关键词：	一种多个小目标自动准确检测方法
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【说明书】：

本发明公开了一种多个小目标的自动准确检测方法，用户输入视频流或者多张图像，通过使用训练好的网络模型进行前向传播运算，计算出物体预测最大的概率得到分类类别和在图像中的X,Y值坐标。本方法具有较好的检测性能，并且借鉴了卷积神经网络自动抽取特征的特性，能够进行多物体检测。通过图像分块与非极大值抑制算法，能够准确检测小目标物体。

技术领域

本发明涉及智能监控视频处理领域，具体涉及一种多个小目标的自动准确检测方法。

背景技术

近年来，随着全国各地平安城市、国家安防等需求日益增进，国家大力发展相关行业技术的研究和实施，视频图像监控技术在其中起着越来越核心的作用，同时大量数据的产生以及如何高效利用大数据带来的信息和内容成为行业前进的关键，智慧监控的图像视频大数据是获取大量有效信息的源头，也为深度学习算法等模型训练验证提供了数据支撑。自2006年以来，深度学习在学术界和工业界持续升温，在语音识别、自然语言处理、图像识别等领域取得了惊人进展，从而推动了人工智能和人机交互的大踏步前进。深度学习成为了新世纪以来最具有技术性和突破性的研究方向，为科技新时代的建立提供了整体的技术框架和核心思路。

传统来说，视频图像中的物体识别可以划分成三个步骤，一个是图像分割，即将图像主体，待识别检测的前景，与背景进行分离，二是通过主体前景进行图像特征的提取，使用数学向量或张量的形式进行简化和特征突出，三是将提取好的图像特征进行机器学习的分类迭代，得到最终物体的类别最大释然估计，预测物体的类别。其中，图像预处理负责降低图像中的噪声并使图像格式符合后续程序需求；图像分割负责找出图像中感兴趣的内容送入后续步骤处理；特征提取负责抽取像素图像的特征(feature)，用某种模式描述图像的主要信息；预测物体的类别是根据目标图像的特征和前期训练好的分类器模型，对图像的类别进行判定；最后输出结果。可以看出，在传统的图像识别算法中，特征提取占据了非常重要的位置。由于分类器接收的输入信号不是原始像素图像而是图像的特征，因此分类器效果的好坏非常依赖于特征提取的质量。在实践中，图像特征的提取是与具体应用领域紧密相关的，比如在人脸识别中的特征脸等。即使在应用领域很小的图像，也需要通过人为进行分析，是否需要使用角点特征，是否需要具有尺寸不变性，旋转不变性，或是其他符合相关类别的特征表示，通过筛选这些不同计算方式得到的特征信息组成共同表示该类别的特征集进行后续机器学习的操作。

物体检测相比较与物体识别，具有更高等级的技术难度和不确定性因素，物体检测不提供前景主体的位置信息，需要进行前景的判断和提取，很大可能一张监控图像包含了多个物体，需要同时确定每个物体的位置和类别，同时因为物体识别中人为判断前景具有人为意识的辅助，物体检测更具有智能化的要求，难度维度要更高一层。DeformableParts Model是物体检测经典的检测方法，具体做法是先进行方向梯度统计，一般是直方图统计的方式，然后使用支持向量机进行参数的训练得到最后的物体网络模型，通过对应的模型进行物体的分类检测。

发明内容

本发明针对当前智能图像分类中需要人工设计特征的繁重任务，且准确率相对不高的现状，本发明提供一种多个小目标的自动准确检测方法。本发明可以快速准确检测出小目标物体中的位置和类别。

本发明采用如下技术方案：

一种多个小目标的自动准确检测方法，基于caffe深度学习框架、VGGNet深度学习网络的多物体检测方法。用户输入视频流或者多张图像，通过使用训练好的网络模型进行前向传播运算，计算出物体预测最大的概率得到分类类别和在图像中的X,Y值坐标。在物体检测网络进行迭代训练之前，需要提供大量的物体图像数据及标定好的xml文件，并且按照4:1的比例随机划分为训练集和验证集。训练集作为学习的部分进行网络的迭代和更新参数，测试集作为检测网络模型是否更新有效。深度学习网络层次越深，模型越复杂，泛化能力也就越强，能够较好的拟合复杂多样的类别。

本方法具体包括如下步骤：

下载完整专利技术内容需要扣除积分，VIP会员可以免费下载。

免登录下载普通用户下载升级VIP会员，免费下载

该专利技术资料仅供研究查看技术是否侵权等信息，商用须获得专利权人授权。该专利全部权利属于华南理工大学，未经华南理工大学许可，擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作，请联系【客服】

本文链接：http://www.vipzhuanli.com/pat/books/202010407732.8/2.html，转载请声明来源钻瓜专利网。

上一篇：一种免疫相关性肺炎预测模型的训练方法
下一篇：一种智能工具箱及控制方法

同类专利

专利分类

G 物理

G06 计算；推算；计数
G06K 数据识别；数据表示；记录载体；记录载体的处理
G06K9-00 用于阅读或识别印刷或书写字符或者用于识别图形，例如，指纹的方法或装置
G06K9-03 .错误的检测或校正，例如，用重复扫描图形的方法
G06K9-18 .应用具有附加代码标记或含有代码标记的打印字符的，例如，由不同形状的各个笔画组成的，而且每个笔画表示不同的代码值的字符
G06K9-20 .图像捕获
G06K9-36 .图像预处理，即无须判定关于图像的同一性而进行的图像信息处理
G06K9-60 .图像捕获和多种预处理作用的组合

免登录下载普通用户下载升级VIP会员，免费下载

[发明专利]一种多个小目标的自动准确检测方法在审

专利文献下载