[发明专利]一种基于深度学习的手术器械仓储环境清点模型压缩方法在审
申请号: | 202211155631.1 | 申请日: | 2022-09-22 |
公开(公告)号: | CN115496964A | 公开(公告)日: | 2022-12-20 |
发明(设计)人: | 王海峰;关思宇;孙志强;蒋文波 | 申请(专利权)人: | 上海可明科技有限公司 |
主分类号: | G06V10/774 | 分类号: | G06V10/774;G06V10/82;G06N3/08;G06N3/04 |
代理公司: | 北京保识知识产权代理事务所(普通合伙) 11874 | 代理人: | 黄骏 |
地址: | 201199 上海市闵*** | 国省代码: | 上海;31 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 深度 学习 手术器械 仓储 环境 清点 模型 压缩 方法 | ||
1.一种基于深度学习的手术器械仓储环境清点模型压缩方法,其特征在于,包括以下步骤:
S1、手术器械数据采集与标注:对手术器械进行拍照采集数据,形成数据集,并根据要求对数据集中的照片进行标签标注;
S2、数据集划分与数据增强:对S1中所得的数据集划分为训练集、验证集和测试集,同时在训练前对数据进行数据增强预处理;
S3、目标检测模型轻量化设计:针对Swin transformer模型进行轻量化结构设计,降低Swin transformer模型所需的内存和运算量,实现模型的压缩;
S4、目标检测模型训练:将S3中经过轻量化设计的目标检测模型代码封装好,然后将数据集输入模型中进行训练,在预先设定的模型训练波次结束后,保存精度最高模型参数,用于仓储环境下手术器械的清点。
2.根据权利要求1所述的一种基于深度学习的手术器械仓储环境清点模型压缩方法,其特征在于,所述S1在进行拍照数据采集时,将所有待检测的手术器械分别按照同类型器械紧靠摆放、同类型器械交叉摆放,不同类型紧靠摆放,不同类型器械交叉摆放、所有器件交叉紧靠混合摆放五种摆放方式依次摆放,用于模拟实际应用中各种复杂情况,确保图像信息采集的丰富性和平衡性。
3.根据权利要求1所述的一种基于深度学习的手术器械仓储环境清点模型压缩方法,其特征在于,所述S1中提到的照片标签标注工作,具体包括以下步骤:
A1、将采集过图像数据的手术器械设定标签名;
A2、将所有采集到的手术器械图片输入到图像标注软件中;
A3、利用标注软件将每一张图像中的所有手术器械使用矩形框标注,即每一张图像中的所有手术器械使用矩形描绘出器械轮廓,矩形轮廓标注满足目标检测模型训练所需的信息,然后标记上所对应的标签名;
A4、完成标记后,将相对应的标签名、图片名和矩形轮廓和位置信息均保存在JSON类型文件中,其中矩形轮廓位置信息是通过在整张图像上建立坐标系,记录多边形每个顶点的x轴和y轴坐标。
4.根据权利要求1所述的一种基于深度学习的手术器械仓储环境清点模型压缩方法,其特征在于,所述S2中提到的训练集、验证集和测试集之间的比例为7:2:1;所述训练集用于训练网络;所述验证集用于训练过程验证模型检测效果,并根据效果调整模型的超参数;所述测试集用于模型效果测试。
5.根据权利要求1所述的一种基于深度学习的手术器械仓储环境清点模型压缩方法,其特征在于,所述S2中提到的数据增强预处理的具体增强方式为Mosaic数据增强,即将多张图像随机缩放、裁剪和排布在一起,增强模型的泛化性。
6.根据权利要求1所述的一种基于深度学习的手术器械仓储环境清点模型压缩方法,其特征在于,所述S3中提到的目标检测模型轻量化设计,具体包括以下内容:
B1、给定一批手术器械图像集合,对集合中输入的图像进行PatchEmdeding操作;
B2、通过全连接层对图像进行转化,然后将转化后的图像输入由5个Swin TransformerBlock组成的特征提取模块,利用特征提取模块将输入特征图等划分为无重叠的数个窗口;
B3、在每个窗口内单独进行自注意力计算,特征提取模块中其他结构与ViT模型相同,包含层归一化、全连接层和残差连接;
B4、将Swin transformer串联的特征提取模块进行连接方式的修改,增加并联连接,增大网络的宽度,同时引入不同尺寸的窗口划分,形成层次性结构,将不同层次的输入作为Faster R-CNN的FPN结构的输入;
B5、通过Faster R-CNN进行最后的目标检测,生成相应的预测框和置信度。
7.根据权利要求6所述的一种基于深度学习的手术器械仓储环境清点模型压缩方法,其特征在于,所述B1中提到的对集合中输入的图像进行PatchEmdeding操作,具体包括以下内容:
C1、使用网格划分工具将图片等尺寸划分为无重叠的若干块;
C2、在自注意力运算的时候,将C1中所得的块转化为48个RGB像素的串联,等效于Transformer中的token。
8.根据权利要求6所述的一种基于深度学习的手术器械仓储环境清点模型压缩方法,其特征在于,所述B4中提到的引入不同尺寸的窗口划分,具体包括以下内容:
将两个不同窗口尺寸分支输出的结构进行Concat操作,然后连接一个池化层,取代原来的PatchEmerging层,使特征图的感受野和通道数增大,形成层次性结构。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于上海可明科技有限公司,未经上海可明科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202211155631.1/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种乳胶发泡文胸垫的制作方法
- 下一篇:一种安全性能高的变压器箱