[发明专利]一种基于深度学习的人工智能学习方法在审
申请号: | 202010424850.X | 申请日: | 2020-05-19 |
公开(公告)号: | CN111612058A | 公开(公告)日: | 2020-09-01 |
发明(设计)人: | 郭扬 | 申请(专利权)人: | 江苏建筑职业技术学院 |
主分类号: | G06K9/62 | 分类号: | G06K9/62;G06N3/04;G06N3/08 |
代理公司: | 南京业腾知识产权代理事务所(特殊普通合伙) 32321 | 代理人: | 马威 |
地址: | 221116 江*** | 国省代码: | 江苏;32 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 深度 学习 人工智能 学习方法 | ||
1.一种基于深度学习的人工智能学习方法,其特征在于:该基于深度学习的人工智能学习方法的具体步骤如下:
S1:获取视频流或者输入图片信息,以视频流或者图片信息作为识别检测的输入数据,且视频流或者图片信息内具有目标物,视频流或者图片信息输入到人工智能识别端;
S2:通过深度学习的方式对输入的图片信息或者视频流进行区域定位,人工智能识别端使用Tiny-DSOD网络对视频流或者图片信息进行区域定位,Tiny-DSOD使用了针对Denseblock进行改进的深度可分离卷积,训练样本的准备:Tiny-DSOD网络所使用的训练样本为各种场景的目标物拍摄图片或者视频流,用水平框对样本进行标注,同时加入一部分无目标物的视频流或者图片信息到训练样本集以避免网络发生误检;
Tiny-DSOD网络训练好后,输入待检测目标物的图片信息或者视频流,Tiny-DSOD网络输出图片中目标物外接框的坐标信息,可以通过这些坐标信息对目标物区域进行裁剪;
S3:基于深度学习识别判断,获取目标物裁剪区域后,训练一个分类网络对目标物是否受到遮挡进行判断,选用MobileNet-v2作为分类模型,MobileNet-v2将深度可分离卷积应用到残差网络结构;
原始的MobileNet-v2在最后输出一个1×1000×1×1的张量并用于1000类物体的分类,将其改为1×2×1×1即可用于2分类;
训练数据的准备:用前面定位模块训练好的网络对原始目标物样本进行处理后可得到裁剪后的目标物图片,人工将受遮挡和未遮挡的样本分开,再使用旋转、模糊等多种手段对数据进行增广,以获得足够多的训练数据,将这两类数据输入到网络进行训练,模型收敛后网络即可正确判断输入目标物图片是否受到遮挡。
2.根据权利要求1所述的一种基于深度学习的人工智能学习方法,其特征在于:所述视频流、图片信息由外接图像采集设备采集并或者集成到人工智能识别端上。
3.根据权利要求1所述的一种基于深度学习的人工智能学习方法,其特征在于:所述Tiny-DSOD网络对不同目标物需要针对性设置识别标签。
4.根据权利要求1所述的一种基于深度学习的人工智能学习方法,其特征在于:所述视频流中目标物区域定位还可以采用机器学习方法k最近邻识别不同帧中的同一目标,具体为:计算下一帧中所有检测到的目标到该目标物的距离,最近的目标即可认为与目标物是相同个体,从而得到每个目标在视频中的运行轨迹。
5.根据权利要求1所述的一种基于深度学习的人工智能学习方法,其特征在于:所述视频流或者图片信息处于逆光时,人工智能识别端采取逆光下目标物细节丢失的位置进行正反样本的搭配,对所有采集的目标物进行人工标注丢失位置,并且以VOC格式进行存储,然后使用深度学习对标注的数据使用残差平方和作为损失函数来进行训练与学习。
6.根据权利要求1所述的一种基于深度学习的人工智能学习方法,其特征在于:所述步骤S1和S2的模型均用Caffe框架进行实现与训练,训练完成后用NCNN神经网络前向计算框架对模型进行格式转换,使其可用于移动端部署。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于江苏建筑职业技术学院,未经江苏建筑职业技术学院许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010424850.X/1.html,转载请声明来源钻瓜专利网。
- 上一篇:多功能履带式自动爬楼搬运车
- 下一篇:一种面向跨界服务的服务模式量化评估方法