[发明专利]分类模型训练方法、分类方法、装置及设备在审
申请号: | 201910901232.7 | 申请日: | 2019-09-23 |
公开(公告)号: | CN110781919A | 公开(公告)日: | 2020-02-11 |
发明(设计)人: | 施诚;彭湃;刘洵;余宗桥;郭晓威 | 申请(专利权)人: | 腾讯云计算(北京)有限责任公司 |
主分类号: | G06K9/62 | 分类号: | G06K9/62 |
代理公司: | 11270 北京派特恩知识产权代理有限公司 | 代理人: | 赵翠萍;张颖玲 |
地址: | 100190 北京市*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 总分类 子分类 样本 分类样本 截止条件 多分类模型 概率 预测 分类结果 模型训练 子类 总类 分类模型训练 装置及设备 分类信息 准确度 分类 | ||
本发明实施例提供了一种分类模型训练方法、分类方法、装置及设备;方法包括:采用子分类样本,持续对原始子分类模型训练,直至预测的子类别的概率值与子分类样本中子分类结果的差异满足第一训练截止条件时为止,得到子分类模型;采用总分类样本持续对原始总分类模型训练,直至预测的总类别的概率值与总分类样本中总分类结果的差异满足第二训练截止条件时为止,得到总分类模型;采用多分类样本持续对原始多分类模型训练,直至预测的子类别的概率值与多分类样本中子分类结果的差异,以及预测的总类别的概率值与多分类样本中总分类结果的差异,满足训练第三训练截止条件时,得到多分类模型。通过本发明实施例,能够提高待分类信息分类的准确度。
技术领域
本发明涉及人工智能领域中的分类技术,尤其涉及一种分类模型训练方法、分类方法、装置及设备。
背景技术
信息分类包括单标签分类和多标签分类,其中,单标签分类指待分类信息仅对应于一个类别标签的分类,而多标签分类指待分类信息同时对应于多个不同的类别标签的分类。由于一般情况下待分类信息是具有多种语义的,因此,对待分类信息进行多标签分类,能够挖掘出待分类信息对应的更多语义信息,并且,分类粒度细,分类效果好。
在对待分类信息进行多标签分类时,通常先对待分类信息进行特征提取,然后基于提取到的特征和训练好的多分类模型确定该待分类信息属于各类别的概率值,最后将各概率值与对应的各预设概率值比较来确定待分类信息所属的类别;然而,在上述的多标签分类过程中,如果训练好的多分类模型在训练过程中多标签类别不全或者样本标注错误时,会导致训练出的多分类模型的分类不准确,因此,待分类信息分类的准确度低。
发明内容
本发明实施例提供一种分类模型训练方法、分类方法、装置及设备,能够提高待分类信息分类的准确度。
本发明实施例的技术方案是这样实现的:
本发明实施例提供一种分类模型训练方法,包括:
获取子分类样本、总分类样本和多分类样本;所述子分类样本为分类信息和子分类结果的样本对,所述总分类样本为子分类结果和总分类结果的样本对,所述多分类样本为分类信息、子分类结果和总分类结果的样本对;
采用所述子分类样本,持续对原始子分类模型训练,直至预测的子类别的概率值与所述子分类样本中子分类结果的差异满足第一训练截止条件时为止,得到子分类模型;所述子分类模型用于确定分类信息的所述子类别的概率值;
采用所述总分类样本,持续对原始总分类模型训练,直至预测的总类别的概率值与所述总分类样本中总分类结果的差异满足第二训练截止条件时为止,得到总分类模型;所述总分类模型用于确定子分类结果的所述总类别的概率值;所述子类别属于所述总类别;
采用所述多分类样本,持续对原始多分类模型训练,直至预测的所述子类别的概率值与所述多分类样本中子分类结果的差异,以及预测的所述总类别的概率值与所述多分类样本中总分类结果的差异,满足训练第三训练截止条件时,得到多分类模型;所述原始多分类模型由所述子分类模型和所述总分类模型连接构建成的;所述多分类模型用于确定分类信息的所述子类别的概率值和所述总类别的概率值。
在上述方案中,所述得到多分类模型之后,所述方法还包括:
当获取到新的多分类样本时,基于所述新的多分类样本,优化所述多分类模型,以利用优化后的多分类模型进行分类。
本发明实施例提供一种基于分类模型的分类方法,所述方法包括:
当获取到待分类信息时,利用多分类模型对所述待分类信息进行分类,得到子分类概率值和总分类概率值;
其中,所述多分类模型是基于用于确定子类别的概率值的模型和用于确定总类别的概率值的模型训练得到的,且,所述多分类模型用于确定分类信息的所述子类别的概率值和所述总类别的概率值,所述子类别属于所述总类别;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于腾讯云计算(北京)有限责任公司,未经腾讯云计算(北京)有限责任公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910901232.7/2.html,转载请声明来源钻瓜专利网。