[发明专利]大批量制作机器学习样本剪裁标记一体化方法有效
申请号: | 201811537324.3 | 申请日: | 2018-12-15 |
公开(公告)号: | CN109815977B | 公开(公告)日: | 2023-06-20 |
发明(设计)人: | 王萍;种洋;王港;庄硕;王琼 | 申请(专利权)人: | 天津大学;中国电子科技集团公司第五十四研究所 |
主分类号: | G06V10/774 | 分类号: | G06V10/774;G06T3/40;G06F3/0482;G06F3/04845;G06F3/0487;G06F9/451 |
代理公司: | 天津市北洋有限责任专利代理事务所 12201 | 代理人: | 李素兰 |
地址: | 300072*** | 国省代码: | 天津;12 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 大批量 制作 机器 学习 样本 剪裁 标记 一体化 方法 | ||
本发明公开了一种大批量制作机器学习样本剪裁标记一体化方法,包括以下步骤:(1)对于尺度大于500Kb而不能直接进行标记的原始图片,使用人机交互界面对原始图片进行剪裁操作,形成多张能直接进行标记的样本图片;(2)对步骤一得到的多个样本图片进行标记,每张样本图片均具有标记框;(3)保存每张样本图片的标记框的位置和大小,并生成xml文件。能方便快捷的进行原始样本的剪裁并调整样本尺度的工作,当原始图片中含有多个可训练的机器样本目标时可全部裁剪并规范化样本命名和尺度大小;在裁剪完成后训练样本的基础上,可直接进行训练目标的标记工作,鼠标和键盘的有效配合能极大提高标记效率,快速完成机器学习样本的制作。
技术领域
本发明方法涉及机器学习所需标签样本的制作方法,尤其涉及大批量需要人工标记的较为方便的样本标记制作方法。
背景技术
样本制作作为机器学习和深度学习技术的前期准备工作,具有耗时耗力但对机器学习训练后的模型影响极大的特点。尤其在现在的大数据时代,大批量的数据如何规整化整理成机器学习框架直接使用的样本更加困难,因数据量的大幅提高,每一份样本制作流程中微小的优化就可能节省大量的时间。因此合理使用键盘鼠标,优化样本制作的基本流程成为关键问题。
一般机器学习框架所需要的图像类样本,是大小合理、包含所训练目标的图片和记载该图片中训练目标位置和大小信息的文本文件。样本的合理尺度约为100kb左右,记载标记信息的文本文件多为xml类型,然而原始图片数据因来源不同而没有统一的规格,有一部分的原始图片数据尺寸较大,不能直接进行样本的标记,需进行裁剪。大部分机器学习应用者在实际制作样本时只能根据自己的需求临时编写工具,因其临时工具功能的有限性可能导致原始数据不能有效利用,并且费时费力。如果有完善的样本制作工具直接使用,会大大提高样本制作的效率。
现有技术中至少存在以下缺点和不足:
(1)当处理尺寸较大的图片时,大部分人直接进行切割,损害了部分可制作成样本的数据。
(2)大部分自己编写的工具操作较为繁琐,易引起误操作,不能合理利用鼠标键盘,耗时费力。
发明内容
针对现有技术,本发明提供了一种更加易用的大批量制作机器学习样本剪裁标记一体化方法,该方法利用Qt框架编写软件,以支持完整的样本制作,适用于不同的原始图片数据,更加高效的利用鼠标键盘,达到快速制作大批量样本的目的。
为了解决上述技术问题,本发明提出的一种大批量制作机器学习样本剪裁标记一体化方法,包括以下步骤:
步骤一、对于尺度大于500Kb而不能直接进行标记的原始图片,使用人机交互界面对原始图片进行剪裁操作,形成多张能直接进行标记的样本图片;
步骤二、对步骤一得到的多个样本图片进行标记,每张样本图片均具有标记框;
步骤三、保存每张样本图片的标记框的位置和大小,并生成xml文件。
进一步讲,本发明所述的大批量制作机器学习样本剪裁标记一体化方法,其中,步骤一包括以下步骤:
步骤1-1、读取原始图片信息,获得该原始图片数据的大小,分配能容纳该原始图片的内存,读入QImage类型的原始图片数据,并保存在内存中;
步骤1-2、将内存中QImage类型的数据转化为QPixmap类型的数据,并在可缩放的QScrollArea组件中显示,利用Qt框架中的事件过滤器机制进行滚轮函数的重新定义,使图片随滚轮的滚动以鼠标位置为中心进行缩放;
步骤1-3、当找到符合满足机器学习样本要求的原始图片位置后,响应键盘的空格信号,由QRubberband派生类生成半透明的子窗口,用来显示要裁剪的位置,并在子窗口的四角放置可更改窗口大小的QSizeGrip组件,利用鼠标进行快速调整窗口大小;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于天津大学;中国电子科技集团公司第五十四研究所,未经天津大学;中国电子科技集团公司第五十四研究所许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201811537324.3/2.html,转载请声明来源钻瓜专利网。