[发明专利]一种基于改进多层感知机的药品字符标签的识别方法有效
申请号: | 201910708433.5 | 申请日: | 2019-08-01 |
公开(公告)号: | CN110598691B | 公开(公告)日: | 2023-05-02 |
发明(设计)人: | 吴健 | 申请(专利权)人: | 广东工业大学 |
主分类号: | G06V20/62 | 分类号: | G06V20/62;G06V30/148;G06V30/16;G06V10/82;G06N3/04;G06N3/084 |
代理公司: | 广州粤高专利商标代理有限公司 44102 | 代理人: | 林丽明 |
地址: | 510006 广东省*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 改进 多层 感知 药品 字符 标签 识别 方法 | ||
本发明涉及机器视觉学习领域,更具体地,涉及一种基于改进多层感知机的药品字符标签的识别方法。包括以下步骤:选取药瓶的字符标签,选取出字符标签中需要识别的区域;将待识别的区域以相片的形式进行预处理,定位目标区域;对目标区域进行划分,将目标区域中字符进行切割,将切割后的字符作为标签字符的数据集;构建多层感知机;将数据集输入到多层感知机中,得到最终的识别结果。本发明改进过的的多层感知机相比于传统的能防止陷入局部极小,寻得最优解。通过对多层感知机引入droupout以解决过拟合问题,引入使用动量的随机梯度下降以防止陷入局部极小的问题,引入ReLU解决梯度弥散的问题;相比于模板匹配法,有着较高的识别率和泛化能力。
技术领域
本发明涉及机器视觉学习领域,更具体地,涉及一种基于改进多层感知机的药品字符标签的识别方法。
背景技术
机器视觉作为一门新兴的学科,近20年来一直以迅猛的速度进行发展,并且机器视觉的发展阶段已经由实验研究走向了实际应用,得到了广泛的工业应用。
药品在我们的日常生活中起到了举足轻重的作用,密切关系着我们的生活,关系着人们的健康甚至是生命健康安全。其中国家规定,在药品上必须表明产品批号、生产日期、有效期这三项内容,而且这三项内容是药品使用安全性的一方面,一般是使用一组阿拉伯数字或者数字加字母加汉字的形式来标识。国家药品管理部门对药厂及药品的检测要求也越来越严格。其中对药品、药品包装的视觉检测和分析是药品检测的重要手段之一。视觉检测作为机器视觉的一种,将其用在药品标签字符的识别上,可以提高生产效率和减少次品率。现有的对于药品标签识别是运用传统的模板匹配法进行识别,其局限性也非常明显,识别准确率不高,泛化能力差,这些都是字符标签识别的瓶颈所在。
发明内容
为了解决现有技术中机器视觉对于药品标签识别准确率不高,泛化能力差的不足,本发明提供了一种基于改进多层感知机的药品字符标签的识别方法。
一种基于改进多层感知机的药品字符标签的识别方法,包括以下步骤:
步骤S1:选取药瓶的字符标签,选取出字符标签中需要识别的区域;
步骤S2:将待识别的区域以相片的形式进行预处理,定位目标区域;
步骤S3:对目标区域进行划分,将目标区域中字符进行切割,将切割后的字符作为标签字符的数据集;
步骤S4:构建多层感知机,使用传统多层感知机作为基础,对其引入droupout以解决过拟合问题,引入使用动量的随机梯度下降以防止陷入局部极小的问题,引入ReLU解决梯度弥散的问题;
步骤S5:将步骤S3中的数据集输入到多层感知机中进行训练以及测试。
优选的,步骤S2中图像预处理的过程包括对图像进行翻转,去噪,灰度化以及二值化处理。
优选的,所述步骤S3中切割出来的每一张字符都需采取归一化操作,保持一样的大小和格式,并且给定对应的标签。
优选的,根据权利要求1所述的基于改进感知机的标签字符识别方法,其特征在于,所述步骤S4中,引入的Droupout结构,每个节点消失的概率:
其中,A为当前迭代次数,a为当前该节点消失的次数。
优选的,步骤S4引入的ReLU解决弥散的问题,即替换感知机的激活函数为一个非线性函数y=max(0,x)。
优选的,步骤S4引入的引入使用动量的随机梯度下降,其公式如下:
计算速度更新:v:=αv-∈g
计算应用更新:θ:=θ+v
其中,学习率∈,初始参数θ,动量参数α,初始速度v,梯度g。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于广东工业大学,未经广东工业大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910708433.5/2.html,转载请声明来源钻瓜专利网。