[发明专利]一种扩充类别式数据快速标注方法在审

申请号：	201910626205.3	申请日：	2019-07-11
公开（公告）号：	CN110334772A	公开（公告）日：	2019-10-15
发明（设计）人：	朱顺意;范继辉;瞿明军;李广立;刘雪健;周莉;巩志远;陈建学;杜来民;邓国超;白玥寅;张松;周雨晨	申请（专利权）人：	山东领能电子科技有限公司;山东大学;太原理工大学
主分类号：	G06K9/62	分类号：	G06K9/62;G06N3/04;G06N3/08
代理公司：	济南金迪知识产权代理有限公司 37219	代理人：	许德山
地址：	250101 山东省济南市历下区新***	国省代码：	山东;37
权利要求书：	查看更多	说明书：	查看更多
摘要：
搜索关键词：	标注样本初始数据集初始数据神经网络训练标注文件模型训练人工微调数据标签样本训练数据集微调应用优化保证统一服务
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【权利要求书】：

1.一种扩充类别式数据快速标注方法，其特征在于，包括以下步骤：

(1)获取带有统一标注A的初始数据，标注A是指的某一大类；

(2)根据需求，结合已有数据集，将A进一步分为多个子类，大类包含所述多个子类；

(3)选取初始数据集的一部分作为样本，通过人工修改标注文件，标注文件是指通过标注工具标注数据后生成的文件，该文件中包含标注信息；将标注从A重命名为多个子类，得到标注样本；

(4)基于标注样本，利用神经网络训练模型，将所得模型对初始数据集中剩余的数据进行预标注，得到预标注数据；

(5)对预标注数据进行人工微调使标注正确，得到微调数据；基于初始数据与微调数据对模型训练优化；并根据所有已标注数据训练最终模型，准确地分类标注全部数据。

2.根据权利要求1所述的一种扩充类别式数据快速标注方法，其特征在于，步骤(1)，是指：直接下载带有统一标注A的公开数据集，或者下载基于公网大数据训练的模型来推理私有数据集，以获得带有统一标注A的初始数据集。

3.根据权利要求1所述的一种扩充类别式数据快速标注方法，其特征在于，步骤(4)，是指：利用人工神经网络对人脑神经元网络进行抽象，建立人工神经网络模型，按不同的连接方式组成不同的网络，并基于此训练人工神经网络模型，将所得人工神经网络模型对初始数据集中剩余的数据进行预标注，得到预标注数据。

4.根据权利要求3所述的一种扩充类别式数据快速标注方法，其特征在于，所述人工神经网络为SSD或YOLO。

5.根据权利要求3或4所述的一种扩充类别式数据快速标注方法，其特征在于，步骤(5)，基于初始数据与微调数据对模型训练优化，是指：基于初始数据与微调数据，利用人工神经网络继续训练模型，得到优化后的模型。

下载完整专利技术内容需要扣除积分，VIP会员可以免费下载。

免登录下载普通用户下载升级VIP会员，免费下载

该专利技术资料仅供研究查看技术是否侵权等信息，商用须获得专利权人授权。该专利全部权利属于山东领能电子科技有限公司;山东大学;太原理工大学，未经山东领能电子科技有限公司;山东大学;太原理工大学许可，擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作，请联系【客服】

本文链接：http://www.vipzhuanli.com/pat/books/201910626205.3/1.html，转载请声明来源钻瓜专利网。

专利分类

专利文献下载