[发明专利]基于半监督深度分类算法的数据分类方法、设备及装置有效
申请号: | 202110488533.9 | 申请日: | 2021-04-30 |
公开(公告)号: | CN113221995B | 公开(公告)日: | 2023-06-30 |
发明(设计)人: | 孙翀;何开杰;王江晴;帖军;郑禄;夏梦;王雪言 | 申请(专利权)人: | 中南民族大学;阿拉山口市科学技术局 |
主分类号: | G06V10/764 | 分类号: | G06V10/764;G06V10/774 |
代理公司: | 深圳市世纪恒程知识产权代理事务所 44287 | 代理人: | 杨培权 |
地址: | 430000 湖北省武*** | 国省代码: | 湖北;42 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 监督 深度 分类 算法 数据 方法 设备 装置 | ||
1.一种基于半监督深度分类算法的数据分类方法,其特征在于,所述方法包括以下步骤:
根据有标签图片数据和无标签图片数据构建的训练图片数据集对初始半监督分类模型进行训练,得到目标半监督分类模型;
通过所述目标半监督分类模型对从图片数据源获取的原始图片数据进行处理,以得到目标图片数据;
通过所述目标图片数据对预设图片分类器进行训练,得到训练后的目标图片分类器,并通过所述训练后的目标图片分类器对待分类图片数据进行分类;
其中,所述通过所述目标图片数据对预设图片分类器进行训练,得到训练后的目标图片分类器,并通过所述训练后的目标图片分类器对待分类图片数据进行分类,包括:
将所述目标图片数据输入至预设图片分类器中进行训练,并检测训练结果;
在检测到训练结果满足预设条件时,获取训练后的目标图片分类器;
获取待分类图片数据,将所述待分类图片数据输入至所述训练后的目标图片分类器进行图片数据分类;
所述将所述目标图片数据输入至预设图片分类器中进行训练,并检测训练结果,包括:
获取图片分类器的分类错误率,并以所述分类错误率作为检测结果;
当所述分类错误率处于预设范围时,判定所述检测结果满足预设条件,并以所述分类错误率所对应的图片分类器作为目标图片分类器;
所述根据有标签图片数据和无标签图片数据构建的训练图片数据集对初始半监督分类模型进行训练,得到目标半监督分类模型,包括:
将有标签图片数据和无标签图片数据构建的训练图片数据集输入至初始半监督分类模型,以获得预测图片数据;
从图片数据源获取标准图片数据,并通过所述初始半监督分类模型中的鉴别器获取所述预测图片数据与所述标准图片数据对应的鉴别结果;
判断所述鉴别结果是否达标;
在所述鉴别结果不达标时,对所述初始半监督分类模型进行迭代训练,获得迭代训练后的半监督分类模型;
基于所述迭代训练后的半监督分类模型,返回所述将有标签图片数据和无标签图片数据构建的训练图片数据集输入至初始半监督分类模型,以获得预测图片数据的步骤,直至判断出鉴别结果达标;
基于鉴别结果达标时的中继半监督分类模型生成目标半监督分类模型;
所述基于鉴别结果达标时的中继半监督分类模型生成目标半监督分类模型,具体包括:
获取鉴别结果达标时对应的预测图片数据,并通过所述中继半监督分类模型的编码器获取所述预测图片数据对应的隐藏变量及所述隐藏变量所对应的隐藏变量分布;
获取隐藏变量的先验分布,并根据wasserstein距离对所述先验分布及所述隐藏变量分布进行度量,获取度量结果;
在所述度量结果未达到预设度量结果时,根据所述中继半监督分类模型的超参数对所述中继半监督分类模型进行迭代训练,获得目标半监督分类模型。
2.如权利要求1所述的方法,其特征在于,所述根据有标签图片数据和无标签图片数据构建的训练图片数据集对初始半监督分类模型进行训练之前,包括:
从图片数据源获取第一无标签图片数据;
对所述第一无标签图片数据进行特征标记,以生成有标签图片数据;
从图片数据源中获取第二无标签图片数据,并根据所述第二无标签图片数据及所述有标签图片数据构建训练图片数据集。
3.如权利要求1或2所述的方法,其特征在于,所述通过所述目标半监督分类模型对从图片数据源获取的原始图片数据进行处理,以得到目标图片数据,包括:
从图片数据源获取原始图片数据;
将所述原始图片数据输入至所述目标半监督分类模型中,得到分类图片数据;
将所述分类图片数据作为所述目标图片数据。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中南民族大学;阿拉山口市科学技术局,未经中南民族大学;阿拉山口市科学技术局许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110488533.9/1.html,转载请声明来源钻瓜专利网。