[发明专利]数据分类方法、装置、电子设备及存储介质有效
申请号: | 201910143402.X | 申请日: | 2019-02-26 |
公开(公告)号: | CN109871896B | 公开(公告)日: | 2022-03-25 |
发明(设计)人: | 张志伟 | 申请(专利权)人: | 北京达佳互联信息技术有限公司 |
主分类号: | G06V10/764 | 分类号: | G06V10/764;G06V10/82;G06K9/62;G06N3/04;G06N3/08 |
代理公司: | 北京柏杉松知识产权代理事务所(普通合伙) 11413 | 代理人: | 项京;丁芸 |
地址: | 100085 北京市海淀*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 数据 分类 方法 装置 电子设备 存储 介质 | ||
本申请是关于一种数据分类方法、装置、电子设备及存储介质。首先,获取待处理数据,并输入预先训练好的数据分类模型;利用数据分类模型,对待处理数据进行特征提取,分别采用第一映射算法和第二映射算法,将提取的特征映射为第一logits向量和第二logits向量;然后,根据第一logits向量计算待处理数据属于各个类别的预测置信度,并用预测置信度对第二logits向量进行调整;最后,根据调整后的第二logits向量,确定分类结果。由于数据分类模型利用预测置信度对第二logits向量进行调整,再将调整后的第二logits向量输入Softmax层计算预测概率,因此能够提高计算出待处理数据属于各个类别的预测概率的可靠性,从而减少误判、提高数据分类的准确性。
技术领域
本公开涉及数据处理技术领域,特别是涉及一种数据分类方法、装置、电子设备及存储介质。
背景技术
在视频图像、语音识别或自然语言处理等相关领域中,都需要进行数据分类。目前,卷积神经网络(CNN)作为深度学习的一个重要分支,具有超强的拟合能力和全局优化能力,因而在上述技术领域中,通常利用CNN模型进行数据的分类。
具体的,如图1所示,相关技术中卷积神经网络包括:卷积层110、池化层120、全连接层130、Softmax层140和输出层150,利用卷积神经网络进行数据分类的过程主要包括如下步骤:
以视频数据的分类为例,首先将待处理的视频数据输入预先训练好的卷积神经网络模型,依次经过卷积神经网络模型的卷积层110、池化层120,进行样本特征的提取及降采样;然后通过全连接层130按预先训练的参数值,采用预设映射算法,对提取到的特征进行映射,得到维度与类别数对应的logits向量,并将logits向量输入至Softmax层140,得到输出向量,输出向量中的各个数值分别表示样本数据属于各个类别的预测概率;最后,由输出层输150根据预测概率和预先设置的概率阈值,得到视频数据的分类结果。
在上述分类过程中,全连接层130按预先训练的参数对提取到的特征进行映射,得到维度与类别数对应的logits向量的步骤,对分类结果是否准确起关键作用。但全连接层130的参数值是训练获得的,其参数值会由选择的训练样本的不同而不同,因此会影响分类结果的稳定性。
发明内容
为克服相关技术中存在的问题,本公开提供一种数据分类方法、装置、电子设备及存储介质。
根据本公开实施例的第一方面,提供一种数据分类方法,所述方法包括:
获取待处理数据;
将所述待处理数据输入预先训练好的数据分类模型;
利用所述数据分类模型,对所述待处理数据进行特征提取;分别采用第一映射算法和第二映射算法对提取的特征进行映射,获得第一logits向量和第二logits向量;根据所述第一logits向量计算所述待处理数据属于各个类别的预测置信度;用所述预测置信度对所述第二logits向量进行调整;根据调整后的所述第二logits向量,确定分类结果;
获得所述数据分类模型输出的分类结果。
可选的,所述数据分类模型为预先训练好的卷积神经网络模型;
所述预先训练好的卷积神经网络模型,包括:卷积层、池化层、第一全连接层、第二全连接层、Sigmoid层、附加层、Softmax层和输出层;
所述利用所述数据分类模型,对所述待处理数据进行特征提取;分别采用第一映射算法和第二映射算法对提取的特征进行映射,获得第一logits向量和第二logits向量;根据所述第一logits向量计算所述待处理数据属于各个类别的预测置信度;用所述预测置信度对所述第二logits向量进行调整;根据调整后的所述第二logits向量,确定分类结果的步骤,包括:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京达佳互联信息技术有限公司,未经北京达佳互联信息技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910143402.X/2.html,转载请声明来源钻瓜专利网。
- 上一篇:电路板的缺陷检测方法和装置
- 下一篇:海林格距离为参考标准的过采样的方法
- 数据显示系统、数据中继设备、数据中继方法、数据系统、接收设备和数据读取方法
- 数据记录方法、数据记录装置、数据记录媒体、数据重播方法和数据重播装置
- 数据发送方法、数据发送系统、数据发送装置以及数据结构
- 数据显示系统、数据中继设备、数据中继方法及数据系统
- 数据嵌入装置、数据嵌入方法、数据提取装置及数据提取方法
- 数据管理装置、数据编辑装置、数据阅览装置、数据管理方法、数据编辑方法以及数据阅览方法
- 数据发送和数据接收设备、数据发送和数据接收方法
- 数据发送装置、数据接收装置、数据收发系统、数据发送方法、数据接收方法和数据收发方法
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置