[发明专利]数据分类方法、装置以及计算机可读存储介质在审
申请号: | 202011364058.6 | 申请日: | 2020-11-27 |
公开(公告)号: | CN112465031A | 公开(公告)日: | 2021-03-09 |
发明(设计)人: | 姚俊荣 | 申请(专利权)人: | 江苏云从曦和人工智能有限公司 |
主分类号: | G06K9/62 | 分类号: | G06K9/62 |
代理公司: | 北京瀚仁知识产权代理事务所(普通合伙) 11482 | 代理人: | 屠晓旭;宋宝库 |
地址: | 215021 江苏省苏州市苏州*** | 国省代码: | 江苏;32 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 数据 分类 方法 装置 以及 计算机 可读 存储 介质 | ||
1.一种数据分类方法,其特征在于,所述方法包括:
获取待分类数据;
利用预设的数据分类模型对所述待分类数据进行分类,以获取所述待分类数据的数据类别;
其中,所述预设的数据分类模型是基于对训练样本进行随机采样与逆采样得到的样本的特征融合结果训练得到的,所述训练样本中一部分类别样本的数量远小于其他类别样本的数量。
2.根据权利要求1所述的数据分类方法,其特征在于,所述预设的数据分类模型包括数据输入模块、特征提取模块、特征融合模块和分类器;所述特征提取模块包括多个顺次连接的特征提取子模块并且首个特征提取子模块与所述数据输入模块连接,最后一个特征提取子模块与所述特征融合模块连接;所述最后一个特征提取子模块包括结构相同的主特征提取单元和附属特征提取单元;
所述特征提取模块被配置成提取输入数据的数据特征;
所述特征融合模块被配置成对所述主特征提取单元与所述附属特征提取单元输出的数据特征进行特征融合,得到特征融合结果;
所述分类器被配置成根据所述特征融合结果进行数据分类。
3.根据权利要求2所述的数据分类方法,其特征在于,所述预设的数据分类模型是通过下列方式训练得到的:
分别对训练样本进行随机采样与逆采样,得到随机采样样本和逆采样样本;
利用下式所示的模型损失函数L并且根据所述特征融合模块输出的所述随机采样样本与所述逆采样样本的特征融合结果,计算所述数据分类模型的模型损失值;
L=α1LCE(Pmix,ynormal)+(1-α1)LCE(Pmix,yreverse)
其中,所述Pmix表示所述分类器根据所述特征融合结果进行数据分类输出的类别预测值,所述ynormal表示所述随机采样样本的类别标签值,所述yreverse表示所述逆采样样本的类别标签值,所述LCE(Pmix,ynormal)表示类别预测值Pmix与类别标签值ynormal的误差函数且LCE(Pmix,ynormal)=-ynormallnPmix,所述LCE(Pmix,yreverse)表示类别预测值Pmix与类别标签值yreverse的误差函数且LCE(Pmix,yreverse)=-yreverselnPmix;所述α1表示模型损失函数的权重且所述iepoch表示当前迭代训练的迭代次数,所述nepoch表示迭代训练的总次数;
根据所述模型损失值,计算所述数据分类模型中每个模型参数各自对应的梯度,并且根据所述梯度反向传播更新所述数据分类模型的模型参数进行模型优化,以完成当前迭代训练;
判断是否满足迭代停止条件;
若是,则停止训练;若否,则执行下一次迭代训练。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于江苏云从曦和人工智能有限公司,未经江苏云从曦和人工智能有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202011364058.6/1.html,转载请声明来源钻瓜专利网。
- 数据显示系统、数据中继设备、数据中继方法、数据系统、接收设备和数据读取方法
- 数据记录方法、数据记录装置、数据记录媒体、数据重播方法和数据重播装置
- 数据发送方法、数据发送系统、数据发送装置以及数据结构
- 数据显示系统、数据中继设备、数据中继方法及数据系统
- 数据嵌入装置、数据嵌入方法、数据提取装置及数据提取方法
- 数据管理装置、数据编辑装置、数据阅览装置、数据管理方法、数据编辑方法以及数据阅览方法
- 数据发送和数据接收设备、数据发送和数据接收方法
- 数据发送装置、数据接收装置、数据收发系统、数据发送方法、数据接收方法和数据收发方法
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置