[发明专利]使用分类属性的数据挖掘在审
申请号: | 201780011254.5 | 申请日: | 2017-02-10 |
公开(公告)号: | CN108701148A | 公开(公告)日: | 2018-10-23 |
发明(设计)人: | R·B·奥弗;A·埃尔达;Y·S·瑞舍夫 | 申请(专利权)人: | 微软技术许可有限责任公司 |
主分类号: | G06F17/30 | 分类号: | G06F17/30 |
代理公司: | 北京市金杜律师事务所 11256 | 代理人: | 王茂华 |
地址: | 美国华*** | 国省代码: | 美国;US |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 子集 属性组合 迭代 移除 关联 分类属性 数据分组 数据挖掘 数据量 匹配 访问 | ||
1.一种计算系统,包括:
至少一个处理器;以及
系统存储器,所述系统存储器具有存储于其上的计算机可执行指令,所述计算机可执行指令在由所述至少一个处理器执行时使得以下各项在所述系统存储器中被实例化:
聚合模块,所述聚合模块被配置为将所访问的数据分组为一个或多个子集,所述数据与一个或多个属性相关联,所述一个或多个属性描述与所述数据相关的信息,所述一个或多个子集包括具有所述一个或多个属性的匹配组合的数据;
扩展模块,所述扩展模块被配置为针对所述一个或多个子集中的每个子集迭代地移除与所述子集相关联的属性组合中的一个或多个所述属性,从而增加所述子集中的每个子集中所包括的数据量;以及
得分模块,所述得分模块被配置为在迭代地移除所述一个或多个属性之后对每个子集进行评分,以确定与所述属性组合相关的一个或多个模式。
2.根据权利要求1所述的系统,其中所述数据是指示计算操作的故障的故障数据,并且其中所述一个或多个模式指示最有可能导致计算操作的故障的所述属性组合。
3.根据权利要求1所述的系统,其中所执行的所述计算机可执行指令在所述系统存储器中进一步实例化:
选择模块,所述选择模块被配置为:选择具有最大数据量的所述一个或多个子集。
4.根据权利要求1所述的计算系统,其中所述一个或多个属性是分类属性。
5.根据权利要求1所述的系统,其中所执行的所述计算机可执行指令在所述系统存储器中进一步实例化:
过滤模块,所述过滤模块被配置为:在由所述聚合模块对所述数据进行分组之前,从所述f数据中过滤掉非分类属性。
6.根据权利要求1所述的系统,其中所执行的所述计算机可执行指令在所述系统存储器中进一步实例化:
后过滤模块,所述后过滤模块被配置为:过滤掉覆盖具有相似得分的交叠子集的一个或多个模式。
7.根据权利要求1所述的系统,其中所执行的所述计算机可执行指令在所述系统存储器中进一步实例化:
输出模块,所述输出模块被配置为:向终端用户提供所述一个或多个模式。
8.根据权利要求1所述的系统,其中所接收的所述数据被组织成表格,所述表格包括与所述数据相对应的行和与所述一个或多个属性相对应的列。
9.根据权利要求1所述的系统,其中所述数据是指示计算操作的一个或多个故障的故障数据,所述故障数据包括在代码执行期间抛出的一个或多个异常、应用崩溃、失效的服务器请求或数据延迟。
10.根据权利要求1所述的系统,其中所述属性包括以下中的一项或多项:地理数据、应用版本数据、错误代码、操作系统版本数据和设备类型信息。
11.根据权利要求1所述的系统,其中所述聚合模块被配置为:通过生成包括相同属性组合的所述数据的计数,对每个子集进行分组。
12.根据权利要求1所述的系统,其中所述评分模块被配置为:通过在覆盖小子集的信息性模式与覆盖大子集的通用模式之间进行平衡来对每个子集进行评分。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于微软技术许可有限责任公司,未经微软技术许可有限责任公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201780011254.5/1.html,转载请声明来源钻瓜专利网。
- 上一篇:用于自动识别农业气候地带的方法和系统
- 下一篇:一种智能推荐方法和终端