[发明专利]一种基于ARM平台的深度学习数字手写体识别方法在审
申请号: | 201810430232.9 | 申请日: | 2018-05-08 |
公开(公告)号: | CN108805222A | 公开(公告)日: | 2018-11-13 |
发明(设计)人: | 杨敏;黄佳凯;荆晓远;程雷 | 申请(专利权)人: | 南京邮电大学 |
主分类号: | G06K9/68 | 分类号: | G06K9/68 |
代理公司: | 南京苏科专利代理有限责任公司 32102 | 代理人: | 牛莉莉 |
地址: | 210023 江*** | 国省代码: | 江苏;32 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 学习 手写数字识别 学习神经网络 摄像头拍摄 数字手写体 照片预处理 模型移植 手写数字 输出结果 图像识别 训练模型 实时性 训练集 准确率 构建 建模 开发 | ||
本发明涉及一种基于ARM平台的深度学习手写数字识别方法,属于图像识别领域,具体步骤为:构建softmax深度学习神经网络模型;利用MNIST训练集训练模型;将深度学习模型移植到ARM平台;摄像头拍摄的手写数字照片预处理;识别并输出结果。本发明利用TensorFlow进行深度学习,具有开发简单、建模速度快、识别准确率高的优点,且ARM嵌入式平台具有成本低、稳定性好、实时性高等诸多优点。
技术领域
本发明涉及一种数字手写体识别方法,尤其是一种基于ARM平台的,利用卷积神经网络和softmax回归计算方法的数字手写体识别方法,属于图像识别处理技术领域。
背景技术
图像识别技术其主要的作用就是按照所观测到的图像,对图像中的物体进行分辨,以此来做好相应的具有意义的判断,具体实现则是应用现代信息处理技术,以及计算机技术对人类认知过程进行模拟。通常情况下,一个图像其识别系统由图像分割、图像特征提取、分类器的识别这三个部分组成,其中,图像分割主要的作用就是将图像划分成为多个区域;图像特征提取则是对多个区域的图像进行相应的特征提取;分类器的识别则是按照图像特征所提取的结果进行适当的分类。总而言之,随着社会的不断发展,图像识别技术也得到了较大的发展,并且也被广泛的应用在各个领域当中,其中就包括医学、航天航空、通信等领域。
随着谷歌基于DistBelief研发的第二代人工智能学习系统TensorFlow的诞生,就被广泛应用于图像识别或语音识别等多项机器学习和深度学习领域。TensorFlow是将复杂的数据结构传输至人工智能神经网络中进行分析和处理过程的系统,该系统进行图像识别都是基于PC的。基于PC机的图像处理系统往往很轻易的就显示出它的结构复杂,成本太高,体积太大,功耗巨大等许多的缺点。同时,我们也知道PC机的最大缺点是桌面操作系统不具有实时性。图像处理系统的实时性和小型化是它发展的必要趋势。嵌入式系统开发技术得到了飞速发展,使嵌入式技术越来越完善。以嵌入式技术为核心的图像处理系统自然也能够成为现实。越来越多的图像处理实时控制问题都可以在嵌入式系统中得以解决实现。同时,伴随嵌入式系统应运而生的嵌入式实时操作系统方便了嵌入式系统开发者的软件编写,在多任务,多中断环境中突出无与伦比的优势。嵌入式图像处理系统以嵌入式芯片为处理核心,体积小,成本低,稳定性好,适应性强等许许多多的优点都能在嵌入式图像处理系统中得到体现。与传统的图像处理系统相比,嵌入式图像处理系统结构紧凑,很多时候不需要PC机的介入,这样大大提高了图像的处理速度,同时有效的降低了嵌入式图像处理系统的成本。图像处理系统还具有拆装方便、配置灵活等别的系统不具有的优点,安全性能同时得到了大大的提高。
发明内容
本发明的目的在于:针对现有技术存在的缺陷,提出一种基于ARM平台的深度学习手写数字识别方法,基于卷积神经网络和softmax回归计算方法构建深度神经网络,以达到优秀的识别精度。
为了达到以上目的,本发明提供了一种基于ARM平台的深度学习数字手写体识别方法,其特征在于:包括以下步骤:
步骤1,构建softmax深度学习神经网络模型;
步骤2,利用MNIST训练集训练模型,将MNIST训练集导入步骤1中构建完成的模型中对模型进行训练,并且检测模型的训练效果;
步骤3,将深度学习模型移植到ARM平台,在ARM平台上搭建TensorFlow,之后在PC端上利用Flash FXP通过SFTP over SSH连接类型,将训练好的深度学习模型导入ARM平台中;其中,FlashFXP为FXP/FTP软件,能够实现服务器和客户机之间的文件传输,而SFTPover SSH为一种文件传输的协议,能够起到更安全的传输文件的作用;
步骤4,利用采集设备采集手写数字照片进行预处理;通过ARM嵌入式平台上的摄像头模块拍摄需要被识别的手写数字图片,在白纸上写下一个在0~9之间的阿拉伯数字,然后利用ARM嵌入式平台上的摄像头模块拍摄白纸上的写下的数字,最终将拍摄的照片进行预处理;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于南京邮电大学,未经南京邮电大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201810430232.9/2.html,转载请声明来源钻瓜专利网。