[发明专利]一种基于注意力机制的金字塔网络的中草药识别方法在审
申请号: | 201910254774.X | 申请日: | 2019-03-31 |
公开(公告)号: | CN110110751A | 公开(公告)日: | 2019-08-09 |
发明(设计)人: | 文贵华;徐映雪;庄奕珊 | 申请(专利权)人: | 华南理工大学 |
主分类号: | G06K9/62 | 分类号: | G06K9/62;G06N3/04 |
代理公司: | 广州粤高专利商标代理有限公司 44102 | 代理人: | 何淑珍;江裕强 |
地址: | 510640 广*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 中草药 注意力机制 金字塔网络 特征融合 结构块 训练集 构建 信息流 注意力 人员识别 使用空间 网络模型 测试集 数据集 准确率 辨别 协同 测试 输出 融合 图片 引入 制作 | ||
本发明公开了一种基于注意力机制的金字塔网络的中草药识别方法,包括以下步骤:1)构建中草药数据集,制作中草药训练集与中草药测试集;2)构建基于通道注意力机制的特征融合结构块,引入竞争注意力模块;3)在金字塔网络的特征融合结构块添加空间注意力机制,使用空间协同注意力模块,对两条信息流进行调整,将调整后的两条信息流融合作为输出;4)构造基于注意力机制的金字塔网络,用中草药训练集进行训练;5)将中草药测试集中的图片传入训练好的网络模型,识别出该图片对应的中草药类别。本发明提高了中草药识别的准确率与性能,并且除了能辅助相关产业人员识别中草药,也能方便非专业人士对中草药的辨别。
技术领域
本发明涉及计算机领域中的图像识别、中医领域的中草药识别的应用技术领域,具体涉及一种基于注意力机制的金字塔网络的中草药识别方法。
背景技术
图像分类识别技术是以数字图像为基础,从图像中提取出特征来对图像的类别进行识别判定。深度卷积神经网络在图片处理领域已经取得了巨大的成功[C.Szegedy,W.Liu,Y.Jia,P.Sermanet,S.Reed,D.Anguelov,D.Erhan,V.Vanhoucke,andA.Rabinovich.Going deeper with convolutions.CVPR,2015.],它能够从复杂的图片数据集中自动建模提取特征,因此已经广泛应用在目标检测[R.Girshick.Fast r-cnn.Proceedings of the IEEE international conference on computer vision,2015]与图像识别[G.Huang,Z.Liu,L.Van Der Maaten,and K.Q.Weinberger.Denselyconnected convolutional networks.CVPR,2017.]上并且有不错的表现。在深度卷积神经网络中,特征金字塔网络[T.-Y.Lin,P.Doll′ar,R.B.Girshick,K.He,B.Hariharan,andS.J.Belongie.Feature pyramid networks for objectdetection.CVPR,2017.]能够以不牺牲模型表达能力、速度以及内存的前提下,产生不同分辨率的特征图,并且在每个尺度上的特征图都融合了较强的语义特征,使得每个尺度的特征都可用来分类以解决多尺度问题。而中草药通常以下特点:某些中草药通过大致的轮廓形状即可区分,而非过于细节的特征;某些中草药则外形相似,需要更为精细的特征才能区分。因此,由于中草药图片通常涉及多种尺度的特征,选择基于特征金字塔网络进行中草药识别任务。
另一方面,在网络内部隐含关系的建模上,通道注意力机制[Hu,Jie,Li Shen,andGang Sun.Squeeze-and-excitation networks.Proceedings of the IEEE conferenceon computer vision and pattern recognition.2018.]可以建模特征通道间的依赖关系,突出强调某些通道上更有用的特征图,而抑制冗余的特征图,从而让网络性能得到提升。由于传统的特征金字塔不加区别地把所有通道的特征图都用上从而导致冗余,有用的特征图没有得到充分的训练,因此有必要对进行融合的信息流引入通道注意力机制,让其隐含的竞争关系更好地权衡每个通道的特征通道关系,减少冗余产生的同时,突出强调在不同层次中通道间更有利于分类的特征图。另外,空间注意力机制[W.Li,X.Zhu,andS.Gong.Harmonious attention network for person re-identification.CVPR,2018.]是在像素级别上对特征进行重新校准的机制,除了能够从全局的角度重新调整特征图的空间分布,还能突出强调更有利于分类的区域,从而让网络性能得到提升。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于华南理工大学,未经华南理工大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910254774.X/2.html,转载请声明来源钻瓜专利网。