[发明专利]一种目标识别分类模型的训练方法、物体识别方法、装置、机器人和介质有效

专利信息
申请号: 201910259811.6 申请日: 2019-04-02
公开(公告)号: CN110059734B 公开(公告)日: 2021-10-26
发明(设计)人: 程郑鑫 申请(专利权)人: 唯思科技(北京)有限公司
主分类号: G06K9/62 分类号: G06K9/62
代理公司: 北京清大紫荆知识产权代理有限公司 11718 代理人: 李红
地址: 100080 北京市*** 国省代码: 北京;11
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 一种 目标 识别 分类 模型 训练 方法 物体 装置 机器 人和 介质
【说明书】:

本公开的实施例提供了一种目标识别分类模型的训练方法、物体识别方法、装置、机器人和介质。采用多个预先标注有类别信息的训练图像对目标识别分类模型进行联合训练,包括:获取图像数据集,所述图像数据集为包括两个以上图像数据子集的联合数据集,其中,所述两个以上图像数据子集的标注类别不完全相同;根据所述两个以上图像数据子集的标注类别,获取各图像数据子集的合并类别群组信息;根据各图像数据子集的类别标签信息和合并类别群组信息,利用softmax群组交叉熵损失函数分别对各图像数据子集进行概率求和,得到目标识别分类的类别概率预测值。以此方式,训练前无需将原来的数据集重新进行标注,能够极大的降低数据标注成本。

技术领域

发明涉及人工智能领域,具体涉及一种目标识别分类模型的训练方法、物体识别方法、装置、机器人和介质。

背景技术

过去几年,深度学习技术在解决诸如视觉识别任务、语音识别任务和自然语言处理任务等很多问题方面都取得了出色的表现。在不同类型的神经网络当中,卷积神经网络是得到最深入研究的,尤其是在计算机视觉识别任务中。早期由于缺乏足够多的训练数据和算力支撑,要在不产生过拟合的情况下训练高性能卷积神经网络是很困难的。随着标记数据的积累和近年来GPU并行运算技术的发展,使得卷积神经网络研究逐渐涌现出来并取得一流结果。

一般地,在主流识别分类任务中,通常都会选用Softmax交叉熵损失函数,同时为了增加算法的鲁棒性,会尽可能多的增加训练数据,但很多时候开源的数据集之间的类别标注标准不统一导致无法增加训练数据。比如基于图像的通用物体检测领域,有诸多高校或者研究机构开源的图像数据集。其中CCTSDB 数据集(CSUST Chinese Traffic SignDetection Benchmark)是由中国交通数据集由长沙理工大学综合交通运输大数据智能处理湖南省重点实验室张建明老师团队制作完成的一个中国交通标注数据集,包含指示标志、禁止标志、警告标志3个类别,图1a示出了CCTSDB数据集中一个图像的示例。而COCO数据集是微软团队开源的一个可以用来图像识别、检测、分割任务的图像数据集,检测任务中标注完成了行人,车辆等共计80个目标类别的信息,图1b示出了 COCO数据集中一个标注图像的示例。

现有的主流物体检测方法,能够分别用CCTSDB数据集和COCO数据集进行训练,那么,所带来的问题是,如果用CCTSDB数据集进行训练,则只能获得一个3个类别检测能力的算法模型;如果再采用COCO数据集进行训练,则该算法模型则又被训练为一个80个目标类别检测能力的算法模型。

但是,根据现有的主流物体检测方法,由于现有的图像数据集的没有统一的标注标准,各数据集的标注标准不一致,此时如果用户想同时联合图像数据集进行训练,例如采用COCO和CCTSDB两个数据集进行训练,想要获得83类别检测能力的算法模型,是无法实现的。

发明内容

因此,为了克服上述现有技术的缺点,本发明提供一种目标识别分类模型的训练方法、物体识别方法、装置、机器人和介质。

为了实现上述目的,提供一种目标识别分类模型的训练方法,所述方法采用多个预先标注有类别信息的训练图像对目标识别分类模型进行联合训练,包括:

获取图像数据集,所述图像数据集为包括两个以上图像数据子集的联合数据集,其中,所述两个以上图像数据子集的标注类别不完全相同;

根据所述两个以上图像数据子集的标注类别,获取各图像数据子集的合并类别群组信息;

根据各图像数据子集的类别标签信息和合并类别群组信息,利用softmax 群组交叉熵损失函数分别对各图像数据子集进行概率求和,得到目标识别分类的类别概率预测值。

优选地,获取各图像数据子集的合并类别群组信息,包括,

获取图像数据集中所有标注类别的数量的并集,将其输出至各图像数据子集,将各图像数据子集的标注类别数量扩展至该并集的数量;

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于唯思科技(北京)有限公司,未经唯思科技(北京)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/201910259811.6/2.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top