[发明专利]使用源跟踪剖析数据在审
申请号: | 201811474571.3 | 申请日: | 2013-08-02 |
公开(公告)号: | CN110096494A | 公开(公告)日: | 2019-08-06 |
发明(设计)人: | 阿伦·安德森 | 申请(专利权)人: | 起元科技有限公司 |
主分类号: | G06F16/215 | 分类号: | G06F16/215;G06F16/00;G06F16/22;G06F16/23;G06F16/245;G06F16/2453;G06F16/25 |
代理公司: | 隆天知识产权代理有限公司 72003 | 代理人: | 石海霞;金鹏 |
地址: | 美国马*** | 国省代码: | 美国;US |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 剖析数据包括访问多个记录集合以为每个特定集合存储量化信息,包括:对于特定集合中记录的至少一个选定字段,值计数条目的相应清单(300A‑300C),每个包括出现在所述选定字段中的值以及其中该值所出现的记录数的计数。处理两个或更多个所述集合的所述量化信息包括:对于来自第一集合和第二集合的每个的至少一个字段,将相应清单的所述值计数条目合并(302)以产生值计数条目组合清单(304),并且将所述值计数条目组合清单的值计数条目聚合(306),以产生特异字段值条目的清单(308),其识别一特异值并且包括对所述两个或更多个集合的每个中该特异值出现的记录数加以量化的信息。 | ||
搜索关键词: | 条目 集合 字段 量化信息 记录数 集合存储 记录集合 数据包括 条目合并 剖析 聚合 量化 跟踪 记录 访问 | ||
【主权项】:
1.一种用于剖析存储在数据存储系统中的数据的方法,所述方法包括:通过耦合至所述数据存储系统的接口来访问存储在所述数据存储系统中的多个记录集合,来为所述多个记录集合的每个存储量化信息,对于特定集合中所述记录的至少一个选定字段而言,每个所述特定集合的所述量化信息包括值计数条目的相应清单,每个值计数条目包括至少出现在所述选定字段中的值以及所述值至少出现在所述选定字段中的记录数的计数;以及处理两个或更多个所述集合的所述量化信息以产生剖析总结信息,所述处理包括:对于来自所述两个或更多个集合的至少第一集合和第二集合的每个的至少一个字段,将相应清单的所述值计数条目合并以产生值计数条目组合清单,以及将所述值计数条目组合清单的值计数条目聚合,以产生特异字段值条目的清单,所述特异字段值条目的至少一些从所述值计数条目的至少一个中识别出特异值;其中对应于特定集合的值计数条目清单中的每个值计数条目还包括识别所述值至少出现在所述选定字段中的所述特定记录集合内各个记录位置的位置信息。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于起元科技有限公司,未经起元科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201811474571.3/,转载请声明来源钻瓜专利网。