[发明专利]构造混合模型的方法有效
申请号: | 201210041495.3 | 申请日: | 2012-02-15 |
公开(公告)号: | CN102693265B | 公开(公告)日: | 2017-08-25 |
发明(设计)人: | R·E·凯兰;B·拉登 | 申请(专利权)人: | 通用电气公司 |
主分类号: | G06F17/30 | 分类号: | G06F17/30;G06N7/00 |
代理公司: | 中国专利代理(香港)有限公司72001 | 代理人: | 何欣亭,朱海煜 |
地址: | 美国*** | 国省代码: | 暂无信息 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 构造 混合 模型 方法 | ||
技术领域
本发明涉及构造混合模型的方法。
背景技术
数据挖掘是用于从数据中提取信息和值的技术。数据挖掘算法用于许多应用中,例如预测购物者对目标市场的消费习惯、检测信用卡诈骗交易、预测顾客的网站的浏览路线、机器的故障检测等。数据挖掘使用多年来由人工智能(AI)和统计建模团体所开发的一系列算法。存在许多不同类的算法,但是它们全部共有一些共同特征,例如(a)表示(隐式地或显式地)数据域的知识的模型,(b)使用训练数据来构造模型的模型构建或学习阶段,以及(3)获得新数据并且对数据应用模型以进行预测的推理工具。已知的示例是线性回归模型,其中通过对第二变量的值进行加权并且对加权值与常数值进行求和,由第二变量来预测第一变量。加权和常数值是模型的参数。
混合模型是学术研究团体中的数据挖掘应用的常用模型,如G McLachlan和D Peel在有限混合模型(Finite Mixture Models)(John Wiley&Sons,(2000))中所述。存在混合模型的类的变化,例如混合专家(Mixture of Experts)和分层混合专家(Hierarchical Mixture of Experts)。还存在用于构建混合模型的有大量文献证明的算法。一个示例是期望最大化(EM)。一般通过识别数据中的簇或成分并且将适当数学函数拟合每个簇,来构造这类混合模型。
发明内容
在一个方面,生成非暂时介质中存储的数据集的一般混合模型(general mixture model)的方法包括下列步骤:提供用于定义数据集的子集的子集标准;在处理器中基于子集标准将数据集划分为至少两个子集;生成至少两个子集的每个的子集混合模型;以及将至少两个子集的每个的子集混合模型组合为一般混合模型。
附图说明
附图包括:
图1是示出按照本发明的一个实施例的生成一般混合模型的方法的流程图。
图2是示出作为图1所示方法的一部分的从子集混合模型过滤成分的方法的流程图。
图3是示出按照图1的生成一般混合模型的方法的数据集的过滤的示例的图表。
图4是示出第一子集的子集混合模型的图表。
图5是示出第二子集的子集混合模型的图表。
图6是示出通过图1公开的方法而构造的一般混合模型的图表。
附图标记说明
100生成一般混合模型的方法;102数据库;104生成具有子集标识的子集;106存在至少一个子集?;108子集标准;110构建每个子集的混合模型;112存在至少两个子集?;114子集模型是一般模型;116需要模型过滤?;118从模型中去除成分;120将子集模型组合;122需要简化?;124组合子集模型是一般模型;126简化组合模型;128简化模型是一般模型;180第一子集数据;190第二子集数据;G1第一簇拟合函数;G2第二簇拟合函数;G3第三簇拟合函数;G4第四簇拟合函数;G5第五簇拟合函数;μ1第一簇的均值;μ2第二簇的均值;μ3第三簇的均值;μ4第四簇的均值;μ5第五簇的均值。
具体实施方式
为便于说明,以下描述中提出了大量具体细节,以便提供对本文所述技术的透彻理解。然而,本领域的技术人员将会清楚地知道,没有这些具体细节也可实施示范实施例。在其它情况下,结构和装置以简图形式示出,以便于示范实施例的描述。
下面参照附图来描述示范实施例。这些附图示出实现本文所述的模块、方法和计算机程序产品的具体实施例的某些细节。但是,附图不应当被理解为施加附图中可存能在的任何限制。方法和计算机程序产品可在任何机器可读介质上提供以用于实现其操作。实施例可使用现有的计算机处理器、或者通过为这个或另一个目的而结合的专用计算机处理器、或者通过硬连线系统来实现。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于通用电气公司,未经通用电气公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201210041495.3/2.html,转载请声明来源钻瓜专利网。
- 上一篇:二次电池
- 下一篇:图像处理系统和图像处理方法