[发明专利]数据处理装置及数据处理方法在审
申请号: | 201410643379.8 | 申请日: | 2014-11-10 |
公开(公告)号: | CN105654102A | 公开(公告)日: | 2016-06-08 |
发明(设计)人: | 夏迎炬;孙健;侯翠琴;杨铭 | 申请(专利权)人: | 富士通株式会社 |
主分类号: | G06K9/62 | 分类号: | G06K9/62;G06N5/02 |
代理公司: | 北京集佳知识产权代理有限公司 11227 | 代理人: | 王萍;李春晖 |
地址: | 日本神*** | 国省代码: | 日本;JP |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 数据处理 装置 方法 | ||
技术领域
本申请的实施例涉及数据处理领域,具体地涉及用于多模型系统中的 模型融合的数据处理装置和数据处理方法。
背景技术
随着社会的进步,信息技术也在飞速发展,如何高效地处理海量的信 息变得尤为重要,机器学习技术在其中起到了重要的作用。机器学习是一 门多领域交叉学科,研究计算机怎样模拟或实现人类的学习行为,以获取 新的知识或技能,重新组织已有的知识结构使之不断改善自身的性能。而 多模型融合则是机器学习中的热门研究方向,多模型融合是使用一系列模 型进行学习,并使用某种规则把各个学习结果进行整合从而获得比单个模 型更好的学习效果的一种机器学习方法。
模型融合的方法有很多种,从模型角度分有同质模型融合和异质模型 融合。同质模型融合是指被融合的多个模型都是同一类型的,比如多个神 经网络的融合、多个决策树的融合。异质模型融合是指被融合的多个模型 不属于同一类型,比如将神经网络、最大熵、决策树等模型进行融合。从 模型的拓扑结构上看有串行和并行方式,串行的方式是多个模型以串行的 方式连接,前一个模型的输出作为后一个模型的输入,由最后的模型给出 系统的最终结果。并行的方式是指多个模型都使用系统的输入进行训练, 各自输出结果,系统将多个模型的结果统合以后给出最终的结果。从处理 方式上看有在特征上进行融合的还有在结果上进行融合。在结果上进行融 合的方法只处理模型输出的结果,通过某种方式将其融合起来。而在特征 上进行融合的方法则将特征空间进行细分,并针对不同的特征空间采用不 同的模型来处理。
发明内容
在下文中给出了关于本发明的简要概述,以便提供关于本发明的某些 方面的基本理解。应当理解,这个概述并不是关于本发明的穷举性概述。 它并不是意图确定本发明的关键或重要部分,也不是意图限定本发明的范 围。其目的仅仅是以简化的形式给出某些概念,以此作为稍后论述的更详 细描述的前序。
根据本发明的一个方面,提供了一种用于多模型系统中的模型融合的 数据处理装置,包括:特征空间划分单元,被配置为将待测数据集的特征 空间分割为多个特征空间划分,以使得该特征空间划分对于多个模型中的 至少一个模型而言是优化的;以及融合单元,被配置为基于训练数据集获 得特征空间上的至少由多个模型的子集融合得到的融合模型,其中,融合 单元以特征空间划分为单位来获得新特征空间划分模式,同时针对新特征 空间划分模式以及各个新特征空间划分使用的、作为多个模型的子集的模 型子集两者进行优化,以获得针对整个特征空间的融合模型的整体最佳性 能。
根据本发明的另一个方面,提供了一种用于多模型系统中的模型融合 的数据处理方法,包括:将待测数据集的特征空间分割为多个特征空间划 分,以使得该特征空间划分对于多个模型中的至少一个模型而言是优化 的;以及基于训练数据集获得特征空间上的至少由多个模型的子集融合得 到的融合模型,其中,以所述特征空间划分为单位来获得新特征空间划分 模式,同时针对新特征空间划分模式和各个新特征空间划分使用的、作为 多个模型的子集的模型子集两者进行优化,以获得针对整个特征空间的融 合模型的整体最佳性能。
依据本发明的其它方面,还提供了相应的计算机程序代码、计算机可 读存储介质和计算机程序产品。
根据本申请的数据处理装置和数据处理方法通过以特征空间划分为 单位来获得新特征空间划分模式,并且针对新特征空间划分模式和各个新 特征空间划分使用的模型子集进行优化,可以获得最优的特征空间划分和 基于该划分的模型子集的最优组合。
通过以下结合附图对本发明的优选实施例的详细说明,本发明的这些 以及其他优点将更加明显。
附图说明
为了进一步阐述本申请的以上和其它优点和特征,下面结合附图对本 申请的具体实施方式作进一步详细的说明。所述附图连同下面的详细说明 一起包含在本说明书中并且形成本说明书的一部分。具有相同的功能和结 构的元件用相同的参考标号表示。应当理解,这些附图仅描述本申请的典 型示例,而不应看作是对本申请的范围的限定。在附图中:
图1是示出了根据本申请的一个实施例的数据处理装置的结构框图;
图2是示出了特征空间划分的一个示意性示例;
图3是示出了根据本申请的一个实施例的特征空间划分单元的结构 框图;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于富士通株式会社,未经富士通株式会社许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201410643379.8/2.html,转载请声明来源钻瓜专利网。