[发明专利]大批量制作机器学习样本剪裁标记一体化方法有效
申请号: | 201811537324.3 | 申请日: | 2018-12-15 |
公开(公告)号: | CN109815977B | 公开(公告)日: | 2023-06-20 |
发明(设计)人: | 王萍;种洋;王港;庄硕;王琼 | 申请(专利权)人: | 天津大学;中国电子科技集团公司第五十四研究所 |
主分类号: | G06V10/774 | 分类号: | G06V10/774;G06T3/40;G06F3/0482;G06F3/04845;G06F3/0487;G06F9/451 |
代理公司: | 天津市北洋有限责任专利代理事务所 12201 | 代理人: | 李素兰 |
地址: | 300072*** | 国省代码: | 天津;12 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 大批量 制作 机器 学习 样本 剪裁 标记 一体化 方法 | ||
1.一种大批量制作机器学习样本剪裁标记一体化方法,包括以下步骤:
步骤一、对于尺度大于500Kb而不能直接进行标记的原始图片,使用人机交互界面对原始图片进行剪裁操作,形成多张能直接进行标记的样本图片;
步骤二、对步骤一得到的多个样本图片进行标记,每张样本图片均具有标记框;
步骤三、保存每张样本图片的标记框的位置和大小,并生成xml文件;
其特征在于,
步骤一包括以下步骤:
步骤1-1、读取原始图片信息,获得该原始图片数据的大小,分配能容纳该原始图片的内存,读入QImage类型的原始图片数据,并保存在内存中;
步骤1-2、将内存中QImage类型的数据转化为QPixmap类型的数据,并在可缩放的QScrollArea组件中显示,利用Qt框架中的事件过滤器机制进行滚轮函数的重新定义,使图片随滚轮的滚动以鼠标位置为中心进行缩放;
步骤1-3、当找到符合满足机器学习样本要求的原始图片位置后,响应键盘的空格信号,由QRubberband派生类生成半透明的子窗口,用来显示要裁剪的位置,并在子窗口的四角放置可更改窗口大小的QSizeGrip组件,利用鼠标进行快速调整窗口大小;
重写子窗口的鼠标消息响应虚函数,使得在原始图片范围内自由拖拽子窗口位置而不影响主窗口中的原始图片;在子窗口中放置用于显示此窗口大小的QLabel,用于提示样本图片的大小是否符合能直接进行标记的图片;
步骤1-4、利用鼠标右击信号来保存当前框选的图片,当框选的图片尺度大小不满足能直接进行标记的样本图片数据尺度时,利用QImage的图片压缩功能进行质量调节,使样本图片达到直接进行标记的图片的尺度要求;
步骤1-5、裁剪的样本图片被保存时,第一张被裁剪的样本图片需要指定保存的位置和名称,名称为罗马数字;保存完成后清除选框并开始新的裁剪选框循环直到此图片不再有符合标准的裁剪位置;
步骤二包括以下步骤:
步骤2-1、用QFileDialog模块下的getExistingDirectory函数来获取用户已经剪裁好的样本图片所存放的路径;扫描所有的样本图片并生成图片列表显示在文件列表区;读入自定义类别文件,明确标记选框的类型;
步骤2-2、载入工作准备完毕后,打开图片进行缩放适应当前窗口的大小,准备对图片进行标记工作,利用setMouseTracking函数打开对鼠标移动信号的追踪功能,实时获取鼠标位置,并生成十字交叉辅助虚线,在标记时依据虚线位置使标记选框的大小覆盖待标记目标;
步骤2-3、重载鼠标响应函数,在十字交叉线的辅助下获取鼠标两次点击的位置作为选框的左上角和右下角,显示出标记选框;此选框和步骤1-2中生成的裁剪选框功能相同,利用Qsizegrip组件和鼠标响应虚函数调节标记选框的大小和位置;
当一张待标记图片有多个相同类型的待标记目标,重写鼠标右击响应信号,在已标记框下右击即可复制当前标记框,追踪鼠标移动轨迹并跟随,放置到预期的位置后再次鼠标左击即可完成标记,其间,鼠标滚轮可调节标记选框的大小;重复操作完成多个同类型的目标标记工作;
步骤2-4、选框结束后显示类别列表对话框,设为模态对话框,在选择一种类别后隐藏,同时保留选框在图片上不消失,并且在选框列表中添加此选框;
步骤2-5、重复步骤2-2到2-4,直到当前图片无可标记对象,此时,切换到下一张待标记图片,切换前进行步骤三中保存xml文件操作;
步骤2-6、当鼠标移动到选框列表上的某一列时,在图片上高亮显示此列对应的标记选框,并使用setFocus函数设置当前焦点和raise函数在多个标记选框重叠的情况下把当前选框置顶;利用Qt的信号与槽机制,把选框列表项的双击信号和选框类别窗口显示函数连接起来,如此可在选类别时误点击的情况下提供修改类别的功能;
步骤三包括以下步骤:
步骤3-1、在切换到另一张图片或者点击保存按钮时触发保存xml文件的函数;如果窗口中并没有标记框则跳过保存工作直接进入下一张图片的标记;
步骤3-2、生成含有此图片信息的文件头,包括:图片的名称、尺寸大小、图像深度;利用xml模块中的createElement函数创建新的节点元素,标明节点名称,对每个节点利用createTextNode函数追加子节点保存相应的信息;
步骤3-3、把当前图片标记框的位置信息映射到真实图片的位置和大小,每一个标记选框对应一个节点元素,节点元素下追加选框的类型信息和位置大小信息;其中,位置大小信息包含选框的左上角坐标和右下角坐标;
步骤3-4、所有信息输入完成后,利用QFile模块将要保存的文件流信息保存为xml文件到当前图片文件夹,文件名与图片的名称保持一致;当再次打开此图片时也同时读入标记选框的信息并将其转换为选框显示在图片上。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于天津大学;中国电子科技集团公司第五十四研究所,未经天津大学;中国电子科技集团公司第五十四研究所许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201811537324.3/1.html,转载请声明来源钻瓜专利网。