[发明专利]数据处理装置、数据处理方法和计算机可读存储介质在审
申请号: | 202011636891.1 | 申请日: | 2020-12-31 |
公开(公告)号: | CN114764934A | 公开(公告)日: | 2022-07-19 |
发明(设计)人: | 郭松;刘汝杰;王梦蛟 | 申请(专利权)人: | 富士通株式会社 |
主分类号: | G06V40/16 | 分类号: | G06V40/16;G06V10/774;G06V10/80;G06K9/62 |
代理公司: | 北京集佳知识产权代理有限公司 11227 | 代理人: | 王萍;王鹏 |
地址: | 日本神*** | 国省代码: | 暂无信息 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 数据处理 装置 方法 计算机 可读 存储 介质 | ||
1.一种数据处理装置,包括:
融合单元,被配置成使用第一样本数据集训练第一分类模型,并且基于所述第一分类模型对所述第二样本数据集进行分类的分类结果将所述第二样本数据集融合到所述第一样本数据集中以形成第三样本数据集;以及
滤除单元和调整单元中的至少之一,
其中,所述滤除单元被配置成对所述第三样本数据集中的属于同一类别的样本数据进行相互比较以滤除相同或相近的样本数据,以及
其中,所述调整单元被配置成使用所述第三样本数据集训练第二分类模型,并且基于所述第二分类模型对所述第三样本数据集的分类结果对所述第三样本数据集中的样本数据进行调整。
2.根据权利要求1所述的数据处理装置,所述融合单元被配置成
使用所述第一分类模型的分类结果计算所述第二样本数据集中的每个类别的分类概率和分类计数比率,
通过针对所述第二样本数据集中的每个类别,将所述分类概率与第一预设阈值进行比较并且将所述分类计数比率与第二预设阈值进行比较来确定该类别的融合方式。
3.根据权利要求2所述的数据处理装置,
其中,所述第二样本数据集中的每个类别的分类计数比率是在属于该类别的样本数据中的、被所述第一分类模型分类为属于第一样本数据集的同一类别的样本数据的数目相对于属于该类别的样本数据的总数目的比率中的最大值,以及
其中,所述第二样本数据集中的每个类别的分类概率是在属于该类别的样本数据中的、被所述第一分类模型分类为与该类别的分类计数比率对应的第一样本数据集的类别的样本数据的分类概率的平均值。
4.根据权利要求2或3所述的数据处理装置,其中,所述融合单元被配置成:针对所述第二样本数据集中的每个类别,
在所述分类概率高于所述第一预设阈值并且所述分类计数比率高于所述第二预设阈值时,将所述第二样本数据集中的属于该类别的样本数据融合到所述第一样本数据集中的相应类别中以形成所述第三样本数据集,以及
在所述分类概率低于所述第一预设阈值并且所述分类计数比率低于所述第二预设阈值时,将所述第二样本数据集中的属于该类别的样本数据设定为所述第三样本数据集中的属于不同于所述第一样本数据集中包括的任一类别的新类别的样本数据。
5.根据权利要求2或3所述的数据处理装置,
其中,所述第一预设阈值包括第一预设高阈值和低于所述第一预设高阈值的第一预设低阈值,
其中,所述第二预设阈值包括第二预设高阈值和低于所述第二预设高阈值的第二预设低阈值,以及
其中,所述融合单元被配置成:针对所述第二样本数据集中的每个类别,
在所述分类概率高于所述第一预设高阈值并且所述分类计数比率高于所述第二预设高阈值时,将所述第二样本数据集中的属于该类别的样本数据融合到所述第一样本数据集中的相应类别中,以及
在所述分类概率低于所述第一预设低阈值并且所述分类计数比率低于所述第二预设低阈值时,将所述第二样本数据集中的属于该类别的样本数据设定为所述第三样本数据集中的属于不同于所述第一样本数据集中包括的任一类别的新类别的样本数据。
6.根据权利要求1至3中任一项所述的数据处理装置,其中,所述滤除单元被配置成计算所述第三样本数据集中的属于同一类别的样本数据相互之间的相似度,并且基于所计算的相似度来滤除相同或相近的样本数据。
7.根据权利要求1至3中任一项所述的数据处理装置,其中,所述调整单元被配置成针对所述第二分类模型的分类结果与类别标签不一致的每个样本数据,通过该样本数据的分类概率与第六预设阈值进行比较来确定是否将该样本数据的类别调整为与所述第二分类模型的分类结果一致的类别。
8.根据权利要求1至3中任一项所述的数据处理装置,其中,
所述第一样本数据集和所述第二样本数据集中的样本数据是人脸图像数据。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于富士通株式会社,未经富士通株式会社许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202011636891.1/1.html,转载请声明来源钻瓜专利网。