[发明专利]基于实例分割的半虚拟数据集自动生成方法有效
申请号: | 202211460573.3 | 申请日: | 2022-11-17 |
公开(公告)号: | CN115937626B | 公开(公告)日: | 2023-08-08 |
发明(设计)人: | 王昊琪;吕林东;李旭鹏;李浩;文笑雨;刘根;张玉彦;孙春亚;姜伟 | 申请(专利权)人: | 郑州轻工业大学;河南许继仪表有限公司 |
主分类号: | G06V10/774 | 分类号: | G06V10/774;G06V10/26;G06V10/82;G06V10/776;G06V20/40;G06V20/70;G06V10/25;G06V10/764;G06N3/0464;G06N3/09 |
代理公司: | 北京哌智科创知识产权代理事务所(普通合伙) 11745 | 代理人: | 张元媛 |
地址: | 450000 河南省郑州*** | 国省代码: | 河南;41 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 实例 分割 虚拟 数据 自动 生成 方法 | ||
1.一种基于实例分割的半虚拟数据集自动生成方法,其特征在于,包括如下步骤:
S1,通过数字孪生体作为实例分割图片数据集的来源,并对实例分割数据集进行标注,形成实例分割数据集;
步骤S1具体为:
S1.1,获取实例分割数据集图像;根据数字孪生体的虚拟场景和数字孪生体的虚拟摄像头获取到数字孪生体视频流,将获取到的数字孪生虚拟对象的仿真动画视频,进行视频取帧,将视频制作成一帧一帧格式统一、像素大小相同的图片;
S1.2,对视频取帧产生的图片进行预处理,删除不符合要求的数据集图片;在收集到的数字孪生体数据集放入网络前,根据图像质量评价算法对数据集质量进行评价,删除不符合要求的图片;其中,图像质量评估算法使用客观无参考图像质量评价中的QAC进行图像质量评估;首先对输入的待评价图像y进行子块分解,将其划分为N个重叠的子块
(1)
在获得每个子块的质量得分
(2)
根据得到的最终质量得分
S1.3,利用Labelme软件对收集到的实例分割虚拟数据图片进行标注,将图片中需要检测的目标进行轮廓标注;每标注一张图片会自动生成图片对应的同名json文件,json文件内容包括图片中目标物体的类别和该目标对应的轮廓坐标点信息;
S2,使用实例分割虚拟数据集对Mask R-CNN网络,进行训练并将迭代训练的模型进行实例分割算法的评估;
步骤S2具体为:
S2.1,将标注好的实例分割数据集json文件转化为实例分割网络可训练的源图片、实例分割掩模图片、标签中的各个类别的名称、源图片与实例分割掩模图片融合的图片;
S2.2,将实例分割数据集图片和标签文件放入到实例分割网络中进行网络训练,将batch size数量的样本放入到实例分割网络中进行预测,并计算预测结果损失,损失总共有五个损失函数,分别是RPN网络的两个损失,最终分类回归的两个损失,以及mask分支的损失函数,根据得到的五个损失计算平均损失,并进行一次参数更新,生成参数更新的实例分割网络,最后,利用上述训练步骤进行多次迭代训练;
S2.3,将迭代训练的模型进行实例分割算法的评估,根据训练好的网络模型和测试集计算模型的MIoU和MPA
S3,利用训练好的实例分割模型检测虚拟对象产生mask图片以及目标的位置坐标和类别信息;
步骤S3具体为:
S3.1,将数字孪生体虚拟对象仿真动画视频流放入训练好的实例分割模型进行检测,根据仿真动画视频流得到的帧画面放入到特征提取网络中获得特征图,并根据特征图获得ROI区域,将获取到的ROI区域送入RPN网络中进行分类和回归,最后将经过RPN网络处理的ROI区域进行多类别分类和候选框回归,并生成Mask图片,每检测一帧视频流画面,产生一张带有目标信息的Mask图片;
S3.2,根据实例分割检测结果获取到检测目标的位置和类别信息,在将数字孪生体虚拟对象仿真动画视频流放入训练好的实例分割模型进行检测时,会检测出目标的坐标和类别信息,为下一步的目标检测的数据集标注文件提供信息;
S4,利用目标的位置坐标和类别信息自动生成半虚拟数据集标注XML文件,根据S3获取到的目标坐标和类别信息,通过代码自动生成半虚拟数据集图像对应的标注文件;标注文件内容包括图片中目标物体的位置和类别信息;
S5,根据mask图片得到数字孪生体物理对象除目标外的背景图和数字孪生体虚拟对象的目标图片,并将两者相互叠加生成半虚拟图片数据集;
步骤S5具体为:
S5.1,通过可二次开发的摄像头获取到一帧数字孪生体物理对象场景画面,作为半虚拟数据集的背景图;
S5.2,将得到的虚拟目标Mask图片分别对数字孪生体物理对象背景图和数字孪生体虚拟对象视频流图片进行处理,得到数字孪生体物理对象除目标外的背景图和数字孪生体虚拟对象的目标图片,并将两者相互叠加生成半虚拟图片数据集;
S5.3,对半虚拟图片数据集进行预处理,对不符合要求的数据集图片进行删除。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于郑州轻工业大学;河南许继仪表有限公司,未经郑州轻工业大学;河南许继仪表有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202211460573.3/1.html,转载请声明来源钻瓜专利网。