[发明专利]生成用于输入分析模型的分析数据集的方法无效
申请号: | 200880130317.X | 申请日: | 2008-07-09 |
公开(公告)号: | CN102089759A | 公开(公告)日: | 2011-06-08 |
发明(设计)人: | 埃里克·马卡德 | 申请(专利权)人: | 凯森公司 |
主分类号: | G06F17/30 | 分类号: | G06F17/30 |
代理公司: | 上海天协和诚知识产权代理事务所 31216 | 代理人: | 张恒康 |
地址: | 法国*** | 国省代码: | 法国;FR |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 生成 用于 输入 分析 模型 数据 方法 | ||
1.一种从存储在至少一个数据库中的数据生成用于输入分析模型的数据集的方法,该方法包括下述步骤:
定义包括多个元组的标记时间的集群且其中各个元组包括用于分析的实体的实体标识符,和至少一个与相应的所述实体标识符相关的参考时间戳;以及
通过为每个实体标识符生成至少一个与时间有关的属性值,从在所述至少一个数据库中与所述实体标识符相关的数据中创建数据集,所述与时间有关的属性值或者每个与时间有关的属性值都表示相应实体标识符的与时间有关的参数,且根据相应的属性定义而生成,其中,所述与时间有关的属性值或者每个与时间有关的属性值依据相应的参考时间戳或每个相应的参考时间戳而生成。
2.根据权利要求1所述的方法,进一步包括以下预备步骤:
将所述实体定义为所述分析模型的分析目标;以及
定义用于描述所述实体的分析记录,所述分析记录包括至少一个由相应的所述属性定义来定义的与时间有关的属性。
3.根据权利要求1或2所述的方法,其特征在于,所述属性定义或每个属性定义以结构化查询语言表述,以便被数据库管理系统执行。
4.根据上述任一权利要求所述的方法,其特征在于,所述标记时间的集群由结构化查询语言定义,以便数据库管理系统执行。
5.根据上述任一权利要求所述的方法,其特征在于,与时间有关的属性定义或每个与时间有关的属性定义包括至少一个在一个或多个数据库的数据上执行的数据操作,其中所述数据库选自包括数据提取、数据转换、数据计算、数据聚集以及数据连接的组中。
6.根据上述任一权利要求所述的方法,进一步包括定义一个或多个属性组,其中每个属性组包括一个或多个具有相似特征的属性集合。
7.一种使用分析模型来分析数据的方法,该方法包括:
根据上述任一权利要求所述的方法生成用于输入分析模型的数据集;
将所述数据集输入所述分析模型;以及
根据所述分析模型执行数据分析。
8.一种预测实体行为的方法,包括使用根据权利要求7所述方法中的分析模型来分析数据。
9.一种训练、评价或回溯测试分析模型的方法,包括使用根据权利要求7所述方法中的分析模型来分析数据。
10.一种用于从存储在至少一个数据库中的数据生成数据集的系统,其中,所述数据集用于输入分析模型中,该系统包括:
输入,用于接收来自数据库的数据;
处理器,用于定义包括多个元组的标记时间的集群,且每个元组包括用于分析的实体的实体标识符,和至少一个与相应的所述实体标识符相关的参考时间戳;并用于通过为每个实体标识符生成至少一个与时间有关的属性值,从在至少一个数据库中与所述实体标识符相关的数据中创建数据集,每个属性值都表示相应实体标识符的与时间有关的参数,且根据属性定义而生成,其中,所述与时间有关的属性值或者每个与时间有关的属性值依据相应时间戳而生成;以及
输出,用于将所述数据集传输至所述分析模型。
11.根据权利要求10所述的系统,其特征在于,所述处理器可操作,以便将所述实体定义为所述分析模型的分析目标;并定义用于描述所述实体的分析记录,所述分析记录包括至少一个由相应的属性定义来定义的与时间有关的属性。
12.根据权利要求10或11所述的系统,进一步包括用户界面,用于定义标记时间的集群、分析记录或者至少一个组成所述分析记录的属性。
13.一种计算机可读媒介,其具有计算机可执行指令,以便计算机系统能够执行根据权利要求1至9任一所述的方法。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于凯森公司,未经凯森公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/200880130317.X/1.html,转载请声明来源钻瓜专利网。
- 上一篇:用于合成N-去甲基吗啡烷化合物的方法
- 下一篇:综自系统光纤通信通道