[发明专利]一种对象分类方法及模型训练方法和装置有效
申请号: | 201910350249.8 | 申请日: | 2019-04-28 |
公开(公告)号: | CN110188798B | 公开(公告)日: | 2023-08-08 |
发明(设计)人: | 李盟;周俊 | 申请(专利权)人: | 创新先进技术有限公司 |
主分类号: | G06F18/24 | 分类号: | G06F18/24;G06N20/10 |
代理公司: | 北京博思佳知识产权代理有限公司 11415 | 代理人: | 林祥 |
地址: | 开曼群岛大开曼岛*** | 国省代码: | 暂无信息 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 对象 分类 方法 模型 训练 装置 | ||
本说明书实施例提供一种对象分类方法及模型训练方法和装置,其中,方法可以包括:获取用于训练对象分类模型的标注样本,所述标注样本中包括:至少两个类别的对象;基于所述标注样本训练得到所述对象分类模型;利用所述对象分类模型,对真实样本进行分类预测,得到真实样本中所述至少两个类别的类别分布;确定真实样本的类别分布与标注样本的类别分布之间的差异比较值;若差异比较值超过差异阈值,根据真实样本的类别分布调整所述标注样本中的类别分布;根据调整类别分布之后的标注样本,重新训练对象分类模型。
技术领域
本公开涉及机器学习技术领域,特别涉及一种对象分类方法及模型训练方法和装置。
背景技术
利用机器学习的手段进行有监督的对象分类,在很多领域均有广泛的应用。例如,对象分类可以包括文本分类、语音分类等。要进行有监督的分类任务,首先需要有一个分类体系,同时在这个分类体系下需要对每个类别标记大量的样本。只有满足了上述两个条件,才可以利用多个类别下的有标记的样本训练对象分类模型,进而通过对象分类模型来完成分类任务。
发明内容
有鉴于此,本说明书一个或多个实施例提供一种对象分类方法及模型训练方法和装置,以提高对象分类的准确度。
具体地,本说明书一个或多个实施例是通过如下技术方案实现的:
第一方面,提供一种对象分类模型的训练方法,所述方法包括:
获取用于训练对象分类模型的标注样本,所述标注样本中包括:至少两个类别的对象;
基于所述标注样本训练得到所述对象分类模型;
利用所述对象分类模型,对真实样本进行分类预测,得到所述真实样本中所述至少两个类别的类别分布;
确定所述真实样本的类别分布与标注样本的类别分布之间的差异比较值;
若所述差异比较值超过差异阈值,根据所述真实样本的类别分布调整所述标注样本中的类别分布;
根据调整类别分布之后的所述标注样本,重新训练所述对象分类模型。
第二方面,提供一种对象分类方法,所述方法包括:
获取待分类的对象集,所述对象集中包括至少两个类别的对象;
利用本说明书任一实施例所述的方法训练得到的对象分类模型,对所述对象集进行分类,得到分类完成的所述至少两个类别的对象。
第三方面,提供一种对象分类模型的训练装置,所述装置包括:
样本处理模块,用于获取用于训练对象分类模型的标注样本,所述标注样本中包括:至少两个类别的对象;
模型训练模块,用于基于所述标注样本训练得到所述对象分类模型;还用于根据分布调整模块调整类别分布之后的所述标注样本,重新训练所述对象分类模型;
分布预测模块,用于利用所述对象分类模型,对真实样本进行分类预测,得到所述真实样本中所述至少两个类别的类别分布;
分布比较模块,用于确定所述真实样本的类别分布与标注样本的类别分布之间的差异比较值;
分布调整模块,用于若所述差异比较值超过差异阈值,根据所述真实样本的类别分布调整所述标注样本中的类别分布。
第四方面,提供一种对象分类装置,所述装置包括:
对象获取模块,用于获取待分类的对象集,所述对象集中包括至少两个类别的对象;
分类处理模块,用于利用本说明书任一实施例所述的方法训练得到的对象分类模型,对对象集进行分类,得到分类完成的所述至少两个类别的对象。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于创新先进技术有限公司,未经创新先进技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910350249.8/2.html,转载请声明来源钻瓜专利网。