[发明专利]数据处理装置及数据处理方法在审
申请号: | 201410643379.8 | 申请日: | 2014-11-10 |
公开(公告)号: | CN105654102A | 公开(公告)日: | 2016-06-08 |
发明(设计)人: | 夏迎炬;孙健;侯翠琴;杨铭 | 申请(专利权)人: | 富士通株式会社 |
主分类号: | G06K9/62 | 分类号: | G06K9/62;G06N5/02 |
代理公司: | 北京集佳知识产权代理有限公司 11227 | 代理人: | 王萍;李春晖 |
地址: | 日本神*** | 国省代码: | 日本;JP |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 数据处理 装置 方法 | ||
1.一种用于多模型系统中的模型融合的数据处理装置,包括:
特征空间划分单元,被配置为将待测数据集的特征空间分割为多个特 征空间划分,以使得该特征空间划分对于多个模型中的至少一个模型而言 是优化的;以及
融合单元,被配置为基于训练数据集获得所述特征空间上的至少由所 述多个模型的子集融合得到的融合模型,其中,所述融合单元以所述特征 空间划分为单位来获得新特征空间划分模式,同时针对所述新特征空间划 分模式以及各个新特征空间划分使用的、作为所述多个模型的子集的模型 子集两者进行优化,以获得针对整个特征空间的融合模型的整体最佳性 能。
2.根据权利要求1所述的数据处理装置,其中,所述融合单元被配 置为使用遗传算法来进行所述优化。
3.根据权利要求1或2所述的数据处理装置,其中,所述融合单元 包括:
权重设置模块,被配置为针对当前特征空间划分模式,基于各个模型 在训练数据集上的性能确定相应模型的权重;
总分值计算模块,被配置为基于所述权重,使用所述模型子集中的各 个模型对每个样本分类获得的分值来计算该样本属于某一类别的总分值; 以及
分类模块,被配置为将最大的总分值对应的类别作为使用该模型子集 对该样本处理获得的结果。
4.根据权利要求3所述的数据处理装置,其中,所述权重设置模块 还被配置为将所述性能低于一定阈值的模型的权重设置为0。
5.根据权利要求1或2所述的数据处理装置,其中,所述融合单元 将基于所述新特征空间划分模式和各个新特征空间划分使用的模型子集 对训练数据集进行处理所获得的结果的正确率作为优化目标函数。
6.根据权利要求1或2所述的数据处理装置,其中,所述特征空间 划分单元包括:
伪标签获取模块,被配置为使用所述多模型系统中不同于目标模型的 模型作为校准模型对待测数据集进行处理,并将处理的结果作为伪标签;
第一特征分布获取模块,被配置为基于所述伪标签获得所述待测数据 集的特征分布;
第二特征分布获取模块,被配置为基于所述目标模型获取所述训练数 据集的特征分布;以及
调整模块,被配置为基于所述训练数据集的特征分布和所述待测数据 集的特征分布来调整所述目标模型的特征空间划分,以使得所述训练数据 集和所述待测数据集针对该特征空间划分具有类似的分布。
7.根据权利要求6所述的数据处理装置,其中,所述调整模块包括:
分区部,被配置为将所述训练数据集和所述待测数据集的特征空间划 分为多个区域;
分布计算部,被配置为分别基于所述训练数据集的特征分布和所述待 测数据集的特征分布,计算相邻的一个或更多个区域在所述训练数据集和 所述待测数据集上的分布;
距离计算部,被配置为计算相邻的一个或更多个区域的两种分布之间 的距离;以及
合并部,被配置为在所述距离小于预定阈值时将所述相邻的一个或更 多个区域合并作为所述特征空间的一个划分。
8.根据权利要求7所述的数据处理装置,其中,所述距离为KL距 离。
9.根据权利要求7所述的数据处理装置,其中,所述距离计算部被 配置为使用贝叶斯量度来计算所述相邻的一个或更多个区域在所述训练 数据集上的分布作为所述距离。
10.一种用于多模型系统中的模型融合的数据处理方法,包括:
将待测数据集的特征空间分割为多个特征空间划分,以使得该特征空 间划分对于多个模型中的至少一个模型而言是优化的;以及
基于训练数据集获得所述特征空间上的至少由所述多个模型的子集 融合得到的融合模型,其中,以所述特征空间划分为单位来获得新特征空 间划分模式,同时针对所述新特征空间划分模式和各个新特征空间划分使 用的、作为所述多个模型的子集的模型子集两者进行优化,以获得针对整 个特征空间的融合模型的整体最佳性能。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于富士通株式会社,未经富士通株式会社许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201410643379.8/1.html,转载请声明来源钻瓜专利网。