[发明专利]一种基于龙芯派的多类别深度学习图像识别方法及其应用有效
申请号: | 201811374115.1 | 申请日: | 2018-11-19 |
公开(公告)号: | CN109543744B | 公开(公告)日: | 2022-10-14 |
发明(设计)人: | 赵静;王弦;谢非;牛友臣 | 申请(专利权)人: | 南京邮电大学 |
主分类号: | G06V10/764 | 分类号: | G06V10/764;G06V10/774;G06V10/82;G06V10/77;G06N3/04;G06N3/08 |
代理公司: | 南京苏科专利代理有限责任公司 32102 | 代理人: | 姚姣阳;杜春秋 |
地址: | 210003 江苏*** | 国省代码: | 江苏;32 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 龙芯派 类别 深度 学习 图像 识别 方法 及其 应用 | ||
本发明提出了一种基于龙芯派的多类别深度学习图像识别方法,该方法包括以下步骤:获取待识别类别的图像数据集;在计算机平台下搭建AlexNet网络模型,并利用图像数据集训练AlexNet网络模型,以得到训练参数;在龙芯派平台下实现多类别深度学习图像识别程序;设计图形用户界面,实现由用户选取待识别图像,自动显示目标图像所属类别。本发明利用了深度学习在图像识别领域的优势,可在龙芯2K1000平台下实现100类日常生活中常见对象的自动分类,具有出色的识别准确率和识别速度,应用前景广泛。
技术领域
本发明涉及一种基于龙芯派的多类别深度学习图像识别方法及其应用,属于嵌入式图像处理技术领域。
背景技术
随着图像处理技术的不断发展,图像识别在各个领域得到了广泛的应用。在工业领域,智能机器人、工业机械臂的运作依赖机器视觉对3D图像进行理解与识别,大大提高了工业生产的效率;在医疗领域,图像识别技术可用于辅助临床诊断和病理研究;在安防领域,人脸识别、指纹识别的应用在保证了安全的前提下,给生活带来了便捷;在环境监测领域,遥感技术与图像处理的结合,常用于地形地质探查,森林、水利、海洋、农业等资源调查和灾害预测。
目前,在计算机平台下图像识别的方法与应用研究取得了丰硕的成果,但是基于国产芯片以及嵌入式平台的图像识别的研究成果却很少。传统的图像识别算法仅在识别简单图像时比较有效,且仅可识别少量特定对象,相较之下神经网络在识别此类对象时具有明显优势。此外,采用多层神经网络的深度学习方法具有较大的计算量,在国产芯片以及嵌入式设备下的处理速度过慢。因此,为了在龙芯派平台下处理多类别复杂图像,并且保证良好的识别率和识别速度,本发明提出了一种多类别深度学习图像识别方法与应用程序。
发明内容
本发明所要解决的技术问题是针对传统图像识别算法在可识别对象数量、对象背景单一的局限性以及深度学习方法过于依赖高性能处理器的缺陷,克服上述现有技术的不足而提供一种基于龙芯派的多类别深度学习图像识别方法及其应用。
本发明提供一种基于龙芯派的多类别深度学习图像识别方法,包括以下步骤:
步骤S1、获取待识别类别的图像数据集;
步骤S2、在计算机平台下搭建AlexNet网络模型,并利用图像数据集训练AlexNet网络模型,以得到训练参数;
步骤S3、在龙芯派平台下实现多类别深度学习图像识别程序;
步骤S4、设计图形用户界面,实现由用户选取待识别图像,自动显示目标图像所属类别。
作为本发明的进一步技术方案,在步骤S1中,图像数据集包括训练集和测试集;对大规模的训练集进行二次整理,筛选出200类对象(涉及生活用品、动植物、交通工具等),每类对象100张图片。此外,每一类对象都包含该对象不同形态、角度、清晰度的图片,并且考虑到单一对象和处于不同背景下的对象。建立txt格式文本,对每一类对象添加相应标签信息。
步骤S2中,在Caffe深度学习框架下,利用图像数据集训练网络模型的方法如下:
S201、图像预处理,通过大小归一化处理,将步骤S2所获取的图像数据集中所有图像都归一化为256*256的大小(如果图像数据集中有长方形的图像,先将短边长度改为256,再裁剪图片中心对应大小的部分),并且对每张图像进行减均值处理;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于南京邮电大学,未经南京邮电大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201811374115.1/2.html,转载请声明来源钻瓜专利网。