[发明专利]依据数据关联规则的必要条件分析方法有效
申请号: | 201510910422.7 | 申请日: | 2015-12-10 |
公开(公告)号: | CN105574087B | 公开(公告)日: | 2018-12-07 |
发明(设计)人: | 史墨轩;张作职 | 申请(专利权)人: | 天津海量信息技术股份有限公司 |
主分类号: | G06F17/30 | 分类号: | G06F17/30 |
代理公司: | 天津市尚文知识产权代理有限公司 12222 | 代理人: | 王晓明 |
地址: | 300020 天津市和*** | 国省代码: | 天津;12 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 依据 数据 关联 规则 必要条件 分析 方法 | ||
一种依据数据关联规则的必要条件分析方法中,针对数据筛选规则进行分析,提取筛选规则中的必要条件组合,必要条件组合中包括必要条件,将必要条件组合中的检索词进行还原,并将每一必要条件项都转换为检索词集合,检索词之间为并集关系,再通过对不同情况下的处理规则的必要条件进行分析,可得到面向不同的业务,不同的规则组配的快速筛选条件,满足了业务上的灵活性,必要条件的分析使用了一系列归并优化的方法既能完全覆盖目标数据又一定程度上继承了规则的精度,满足了完整性和复杂性。
技术领域
本发明涉及数据处理的技术领域,具体说是一种依据数据关联规则的必要条件分析方法。
背景技术
随着大数据领域的不断发展,针对海量数据的处理变得越来越普遍。当前互联网数据的存量在飞速的增长,针对大数据的处理都会面临一个根本性的问题,如何在海量的数据中找到自己想要的数据。通常这些数据都具有离散性、不可预测性以及主观性等特点,为满足各种个性化的数据筛选需求,业界通常都使用了可灵活组配的规则来解决这个问题。但是随着数据量的增加,以及筛选规则的日益复杂,筛选的性能问题逐渐凸显,慢慢变成了阻碍整个业务最严重的环节。为了解决这个问题,需要让数据在具体进行规则筛选之前进行一次初筛,而初筛使用的条件来源于规则的必要条件,不同的业务需求使用的规则必要条件不尽相同,数量也成千上万,但其中有相同部分,有相似部分,有重叠部分,如何进行必要条件的分析以减少冗余计算的快速筛选条件是当前大数据处理行业所面对的主要问题。
发明内容
本发明要解决的技术问题是提供一种依据数据关联规则的必要条件分析方法。
本发明为解决公知技术中存在的技术问题所采取的技术方案是:
本发明的依据数据关联规则的必要条件分析方法,包括以下步骤:
A、针对数据筛选规则进行分析,提取筛选规则中的必要条件组合,必要条件组合中包括必要条件;
B、将必要条件组合中的检索词进行还原,并将每一必要条件项都转换为检索词集合,检索词之间为并集关系;
C、如果必要条件组合中仅包含一个必要条件项的,则对该必要条件项进行单独提取;
D、如果一个必要条件组合的其中一个必要条件项被包含在了另一个必要条件项的范围中,则放弃该必要条件组合,而保留另一个必要条件项;
E、如果存在相同的必要条件组合则进行消重,只保留其中一组必要条件组合;
F、对同一个必要条件项中的检索词进一步抽象出更少的公共条件;
G、如果多组必要条件组合中的对应必要条件项相等或存在包含关系,则视为同一个条件项,只保留母集对应的必要条件组合;
H、如果多组必要条件组合中存在相同的部分,则对相同部分进行提取,对不同部分进行合并;
I、按照数据类型进行分类汇总,以获得数据快速筛选条件。
本发明还可以采用以下技术措施:
步骤H中,舍弃不同的必要条件项,只保留公共部分的必要条件项。
本发明具有的优点和积极效果是:
本发明的依据数据关联规则的必要条件分析方法中,通过对处理规则的必要条件进行分析,得到面向不同的业务,不同的规则组配的快速筛选条件,满足了业务上的灵活性,必要条件的分析使用了一系列归并优化的方法既能完全覆盖目标数据又一定程度上继承了规则的精度,满足了完整性和复杂性。
具体实施方式
以下通过具体实施例对本发明进行详细说明。
A、针对数据筛选规则进行分析,提取筛选规则中的必要条件组合,必要条件组合中包括必要条件;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于天津海量信息技术股份有限公司,未经天津海量信息技术股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201510910422.7/2.html,转载请声明来源钻瓜专利网。
- 数据显示系统、数据中继设备、数据中继方法、数据系统、接收设备和数据读取方法
- 数据记录方法、数据记录装置、数据记录媒体、数据重播方法和数据重播装置
- 数据发送方法、数据发送系统、数据发送装置以及数据结构
- 数据显示系统、数据中继设备、数据中继方法及数据系统
- 数据嵌入装置、数据嵌入方法、数据提取装置及数据提取方法
- 数据管理装置、数据编辑装置、数据阅览装置、数据管理方法、数据编辑方法以及数据阅览方法
- 数据发送和数据接收设备、数据发送和数据接收方法
- 数据发送装置、数据接收装置、数据收发系统、数据发送方法、数据接收方法和数据收发方法
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置