[发明专利]一种基于改进的Tiny-YOLO v4自然环境下舌像检测定位方法有效
申请号: | 202210517301.6 | 申请日: | 2022-05-12 |
公开(公告)号: | CN114998220B | 公开(公告)日: | 2023-06-13 |
发明(设计)人: | 辛国江;朱磊;梁昊;王鑫;张杨;刘嵘澂 | 申请(专利权)人: | 湖南中医药大学 |
主分类号: | G06T7/00 | 分类号: | G06T7/00;G06V10/762;G06V10/764;G06V10/776;G06V10/80;G06V10/82;G06V10/40;G06V10/25;G06N3/0464;G06N3/08;G16H10/60;G16H30/20;G16H50/20 |
代理公司: | 北京律谱知识产权代理有限公司 11457 | 代理人: | 黄云铎;孙红颖 |
地址: | 410208 湖南省长沙市含*** | 国省代码: | 湖南;43 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 改进 tiny yolo v4 自然环境 下舌像 检测 定位 方法 | ||
1.一种基于改进的Tiny-YOLO v4自然环境下舌像检测定位方法,包括a步骤、收集舌像数据,并制作舌像数据集;
b步骤、构建改进Tiny-YOLO v4网络结构,在所述改进网络结构基础上实施与结构相匹配的Tiny-YOLO v4目标检测方法,所述改进网络结构包括特征提取骨干网络、协同注意力机制模块、特征融合模块和多分类器模块;
c步骤、利用a步骤的数据集对所述与结构相匹配的Tiny-YOLO v4目标检测方法进行训练,将训练后最佳的权重文件加载至Tiny-YOLO v4目标检测方法中得到目标检测网络模型,训练中采用Mosaic数据增强方法对舌像数据集进行扩充,采用K-Means聚类方法对舌像尺寸进行分类;
d步骤、目标检测网络模型训练完成后进行多组独立数据集测试,在自然环境下快速定位检测舌体的位置并评价模型检测效果;
其中所述特征提取骨干网络为轻量化的CSPDarknet53网络结构,所述轻量化CSPDarknet53网络结构输出两个大小分别为26*26,13*13的浅层特征图,两个浅层特征图分别输入到所述协同注意力机制模块中,提取空间位置信息和通道权重信息,并通过连接操作将空间位置信息和通道权重信息融合得到中间特征图,然后将中间特征图传输到所述特征融合模块中,经过上采样、卷积和连接操作获取更高维度语义信息特征图,所述多分类器模块基于特征融合模块输出的两个13*13和26*26尺度的融合特征进行分类检测,输出最终的目标检测结果;
所述轻量化的CSPDarknet53网络结构具体包括:依次连接的第一Darknet卷积层模块、第二Darknet卷积模块、第一Resblock_body模块、第二Resblock_body模块、第三Resblock_body模块、第三Darknet卷积层模块,所述第一Darknet卷积层模块包含二维卷积操作、归一化和非线性激活函数,输入的的舌像图片经过第一Daeknet卷积层之后输出大小为208*208的特征图,传输到第二Darknet卷积层模块;然后再传入到第一Resblock_body模块输出大小为52*52的浅层特征图传输到第二Resblock_body模块;第二Resblock_body模块输出大小为26*26的浅层特征图有两个走向,一方面传入协同注意力机制模块中,另一方面传入第三Resblock_body模块中;第三Resblock_body模块输出大小为13*13的浅层特征图传入第三Darknet卷积层;Resblock_body模块包含一次下采样和多次残差结构的堆叠,避免训练过程中出现梯度消失或梯度爆炸问题,使神经网络层数更多;
所述协同注意力机制模块包括协同信息编码模块和协同注意力生成模块,其中协同信息编码模块提取来自第二Resblock_body模块的和第三Draknet卷积层模块的特征图中标注目标的空间坐标信息和通道权重信息,协同注意力生成模块通过连接操作将提取得到的空间坐标信息和通道权重信息融合在一起形成中间特征图,输出两个大小为13*13和26*26的中间特征图传输到特征融合模块中。
2.如权利要求1所述的方法,其中所述舌像数据集按下述方法制作:根据需要识别的目标收集自然环境下和标准环境下舌像图片数据,利用标签制作工具将图片数据中的检测目标进行标注,完成之后将数据集按比例随机分为训练集和测试集,所述标签制作工具为Labelimg标签制作工具。
3.如权利要求2所述的方法,其中所述舌像数据集的格式为VOC格式,其中包括图片数据文件夹、存放xml标签文件的文件夹和保存图片路径的文件,所述标签制作工具Labelimg将图片数据中的检测目标标记后,会自动生成存放标签的文件,文件中记录标签的具体位置坐标信息和标签名称。
4.如权利要求1所述的方法,所述特征融合模块包括,依据数据流向依次连接的第一卷积层、上采样层、连接层和第二卷积层,获得更高维度语义信息的特征图,同时输出两个大小为13*13,26*26的特征图至多分类器模块器中;其中协同注意力机制模块输出的中间特征图输入到第一卷积层,经过卷积输出大小为13*13的融合特征至多分类器模块中;中间特征图同时经过上采样层后输入连接层,再输入到第二卷积层中,输出大小为26*26的融合特征至多分类器模块中。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于湖南中医药大学,未经湖南中医药大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202210517301.6/1.html,转载请声明来源钻瓜专利网。
- 上一篇:基于翻转式发光板安装前双面污垢去除设备
- 下一篇:一种废气冷凝回收低温机组