[发明专利]分类器训练方法、装置、设备以及存储介质有效
申请号: | 202010715621.3 | 申请日: | 2020-07-22 |
公开(公告)号: | CN111860656B | 公开(公告)日: | 2023-06-16 |
发明(设计)人: | 孙翀;毕建权;王江晴;李子茂;帖军;田莎莎;何开杰 | 申请(专利权)人: | 中南民族大学;北京青苔数据科技有限公司 |
主分类号: | G06F18/23213 | 分类号: | G06F18/23213;G06F18/214;G06F18/25 |
代理公司: | 深圳市世纪恒程知识产权代理事务所 44287 | 代理人: | 宋朝政 |
地址: | 430074 湖北省武汉*** | 国省代码: | 湖北;42 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 分类 训练 方法 装置 设备 以及 存储 介质 | ||
本发明公开了一种分类器训练方法,所述方法包括以下步骤:获取训练样本,所述训练样本包括多个示例;对所述多个示例进行聚类,获得簇中心集;根据所述簇中心集,获得所述簇中心集的边集;根据所述边集和所述簇中心集构建图结构;利用所述图结构训练获得分类器。本发明还公开了一种分类器训练装置、设备以及存储介质。由于,在利用训练样本训练获得分类器之前,通过确定训练样本中的多示例的簇中心集,并构建簇中心集的图结构,发掘出训练样本簇中心集中的簇中心间的关系,使得利用图结构训练获得的分类器在进行数据分类时,数据的分类的准确率更高。
技术领域
本发明涉及数据分类技术领域,特别涉及一种分类器训练方法、装置、设备以及存储介质。
背景技术
随着人工智能的发展,机器学习在人工智能领域占据着的核心地位,其中,多示例学习逐渐成为机器学习领域关注的一个研究热点。在多示例学习中,首先获得训练样本,其中,训练样本包含多个示例,然后将包括多个示例的训练样本输入分类器中进行训练,以获得结果分类器,然后利用获得的结果分类器进行数据分类。
但是,用上述方法训练获得的结果分类器对数据进行分类时,数据的分类结果准确率较差。
发明内容
本发明的主要目的是提供一种分类器训练方法、装置、设备以及存储介质,旨在解决现有技术中数据的分类结果准确率较差的技术问题。
为实现上述目的,本发明提出一种分类器训练方法,所述方法包括以下步骤:
获取训练样本,所述训练样本包括多个示例;
对所述多个示例进行聚类,获得簇中心集;
根据所述簇中心集,获得所述簇中心集的边集;
根据所述边集和所述簇中心集构建图结构;
利用所述图结构训练获得分类器。
可选的,所述利用所述图结构训练获得分类器的步骤包括:
将所述图结构输入图卷积神经网络中进行训练,获得分类器。
可选的,所述根据所述簇中心集,获得所述簇中心集的边集的步骤包括:
将所述簇中心集中满足预设条件的两个簇中心之间建立一条边,获得所述簇中心集的边集,所述预设条件为所述两个簇中心间的距离小于预设阈值。
可选的,所述将所述图结构输入图卷积神经网络中进行训练,以获得分类器的步骤包括:
根据所述边集,建立邻接矩阵;
将所述簇中心集和所述邻接矩阵输入图卷积神经网络进行训练,获得所述簇中心集中各簇中心的重要度分数值;
将所述簇中心集中各簇中心按照所述重要度分数值从高到低进行排序,并获取重要度分数值排序前K的K个簇中心以及所述K个簇中心的子边集,K为不大于所述簇中心集中的簇中心数量的正整数;
根据所述K个簇中心以及所述子边集,对所述邻接矩阵和所述簇中心集进行更新,以获得更新后的图结构;
判断所述重要度分数值的维度是否等于预设类别数量;
若是,对所述更新后的图结构进行一次性融合,获得分类器。
可选的,所述判断所述重要度分数值的维度是否等于预设类别数量的步骤之后,所述方法还包括:
若否,则返回执行将所述簇中心集和所述邻接矩阵输入图卷积神经网络进行训练,获得所述簇中心集中各簇中心的重要度分数值的步骤,循环至所述重要度分数值的维度等于预设类别数量。
可选的,所述根据所述边集,建立邻接矩阵的步骤包括:
所述根据所述边集和公式一,建立邻接矩阵;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中南民族大学;北京青苔数据科技有限公司,未经中南民族大学;北京青苔数据科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010715621.3/2.html,转载请声明来源钻瓜专利网。