[发明专利]一种基于低分辨率压缩图像的IOT便携式设备视觉识别加速方法在审
申请号: | 201810778973.6 | 申请日: | 2018-07-16 |
公开(公告)号: | CN109086806A | 公开(公告)日: | 2018-12-25 |
发明(设计)人: | 钱慧;陈晓旭 | 申请(专利权)人: | 福州大学 |
主分类号: | G06K9/62 | 分类号: | G06K9/62;G06N3/04;G06N3/08 |
代理公司: | 福州元创专利商标代理有限公司 35100 | 代理人: | 蔡学俊 |
地址: | 350108 福建省福*** | 国省代码: | 福建;35 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 推理 低分辨率 便携式设备 视觉识别 压缩图像 原始图像 卷积神经网络 图像数据传输 实时显示 通过设备 图像采集 压缩 采集端 计算量 数据量 采集 | ||
1.一种基于低分辨率压缩图像的IOT便携式设备视觉识别加速方法,其特征在于:包括以下步骤:
步骤S1:通过设备的采集端进行图像采集,获得原始图像;
步骤S2:将步骤S1采集到的原始图像经过低分辨率压缩,减少数据量,并将压缩后的图像数据传输至设备的推理端;
步骤S3:设备的推理端利用已经训练好的卷积神经网络进行推理识别,并将推理识别结果实时显示出来。
2.根据权利要求1所述的一种基于低分辨率压缩图像的IOT便携式设备视觉识别加速方法,其特征在于:所述步骤S2中,采用M×N的高斯随机矩阵对原始图像进行低分辨率压缩,该矩阵中的元素服从均值为0、方差为1的正态分布,且元素间相互独立,其中M为低分辨率压缩后图像像素个数,N为原始图像像素个数。
3.根据权利要求1所述的一种基于低分辨率压缩图像的IOT便携式设备视觉识别加速方法,其特征在于:步骤S3中,将经过低分辨率压缩得到的图像数据作为卷积神经网络的输入单元,将经过低分辨率压缩的一维数据重新调整成二维数据并作为卷积神经网络的输入。
4.根据权利要求1所述的一种基于低分辨率压缩图像的IOT便携式设备视觉识别加速方法,其特征在于:步骤S3中,所述卷积神经网络采用LeNet-5结构,包括卷积层1、池化层1、卷积层2、池化层2、全连接层3以及全连接层4;其中,卷积层1、卷积层2分别由32个和64个大小为5×5、步长为1的滤波器组成,采用padding进行补零操作,保证卷积层输入维度和输出维度一致;池化层1、池化层2均由大小为2×2、步长为2的滤波器组成,采用最大池化方式下采样;全连接层3和全连接层4分别产生256×1和10×1的有效特征向量。
5.根据权利要求4所述的一种基于低分辨率压缩图像的IOT便携式设备视觉识别加速方法,其特征在于:步骤S3中,所述卷积神经网络使用ReLU作为激活函数,最终经过softmax分类器选择向量最大值确定识别内容。
6.根据权利要求4所述的一种基于低分辨率压缩图像的IOT便携式设备视觉识别加速方法,其特征在于:所述卷积神经网络的训练具体为:利用55000张MNIST手写数字图像作为训练集,卷积神经网络每次输入样本的批尺寸大小为100,为了防止过拟合现象,全连接层FC3中设置dropout为0.7,损失函数采用交叉熵,并使用Adam优化算法,学习率设置为0.0001进行权重参数优化,利用不同的5000张MNIST图像作为验证集,进行超参数调整,通过不断的迭代,达到最佳的识别精度。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于福州大学,未经福州大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201810778973.6/1.html,转载请声明来源钻瓜专利网。