[发明专利]一种规律挖掘和执行系统及其方法有效
申请号: | 201010560989.3 | 申请日: | 2010-11-26 |
公开(公告)号: | CN102012918A | 公开(公告)日: | 2011-04-13 |
发明(设计)人: | 王志伟;王凯玺;张鑫;张行 | 申请(专利权)人: | 中金金融认证中心有限公司 |
主分类号: | G06F17/30 | 分类号: | G06F17/30 |
代理公司: | 北京锐思知识产权代理事务所(普通合伙) 11341 | 代理人: | 李涛 |
地址: | 100054 北京市*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 规律 挖掘 执行 系统 及其 方法 | ||
1.一种规律挖掘和执行系统,其特征在于所述系统包括五个模块:
事件识别模块;
事件元素编码、量化数据离散化模块;
规律提取模块;
规则库及维护模块;
规则匹配模块;
其中,所述规律提取模块还包括三个子模块:简单事件规律提取子模块、复杂事件规律提取子模块、习惯行为识别模块。
2.如权利要求1所述的规律挖掘和执行系统,其中,所述事件识别模块的输入,为历史交易数据和当前执行事件,输出为输入事件的类别及其事件对象或对象集;
所述事件识别模块对交易数据库中或即将到来的事件进行定性分类,分为三类:简单事件、复杂事件、习惯事件。
3.如权利要求1所述的规律挖掘和执行系统,其中,所述事件元素编码、量化数据离散化模块,其输入为所述事件识别模块的对象或对象集,输出为输入对应的二进制字符串;
所述事件元素编码、量化数据离散化模块使用特有编码方式:基于编辑距离的差异编码;除将属性进行编码外,该模块还负责将量化的数据进行离散化,也就是对连续的属性值进行分段标记。
4.如权利要求1所述的规律挖掘和执行系统,其中,所述简单事件规律提取模块,通过采用基于优化的FP树的Apriori算法对风险事件样本学习来产生规则,针对历史数据库中的被标记为风险的简单事件进行的规律发现,其目的为发现在风险简单事件中各属性值的出现情况,即为对属性值的频繁项集挖掘。
5.如权利要求1所述的规律挖掘和执行系统,其中,所述复杂事件规律提取模块,针对蕴含时间逻辑的历史事件序列,发现前后事件之间的逻辑关系及属性值变化,进而挖掘规律,并经进一步编码后形成代表规则的含有通配符的规律二进制串,所述规则是规律提取后的表示形式。
所述复杂事件规律提取模块采用自动机逆向老化构建算法,能够按照自动机理论,首先利用最末事件构建自动机终点,然后向前发现自动机始点,并对事件属性进行编辑编码,进而形成事件的编码,然后通过对比前后事件相应属性位或属性位的属性值,并判断各属性的重要程度及属性值之间的涵盖程度,最终得出前后事件的逻辑关系,完成通配替换后完成对事件集的二进制编码。
同时,所述复杂事件规律提取模块还能针对某些属性位产生差异编码,即能够逆向跟踪某属性位的属性值变化的轨迹,根据差异生成编码,历史数据库中将会记录最终事件。
6.如权利要求1所述的规律挖掘和执行系统,其中,所述规则库及维护模块,执行简单事件规则库维护和复杂事件规则库维护;执行简单事件规则库维护,主要负责对在历史交易库中有风险的简单事件进行频繁项集挖掘后,对结果的整理和维护;执行复杂事件规则库,是对已有针对复杂事件的规则的数量求精和精度合并;
随着时间的积累,规则会越来越多,数据库中记录将会越来越多,为避免规则蕴含和规则重合现象的产生,所述规则库及维护模块,在新规则存到规则库之前通过与已有规则的对比来决定新规则对规则库产生的影响和定期根据某规则被执行的情况及其误判率来修正规则库;
其中,在决定新规则对规则库产生的影响时,是通过计算同类型下每个相应属性位之间的编辑距离,再依据属性位在二进制串中的位置将会产生基于编辑距离的向量,继而计算新规则与已有规则之间的含影响系数的欧式距离。
7.如权利要求1所述的规律挖掘和执行系统,其中,所述规则匹配模块包括三个子模块:简单事件规则匹配子模块、复杂事件规则匹配子模块、习惯行为判定模块;
8.如权利要求7所述的规律挖掘和执行系统,其中,所述简单事件规则匹配模块,当前事件如果被判定为简单事件,则会与规则库中简单事件规则进行对比,根据当前事件的属性值与频繁项集的匹配程度,给出风险预估;
所述复杂事件规则匹配模块,根据风险事件规则对当前事件给出风险预估;首先取滑动窗口范围内的同账户事件形成事件集,当前事件作为事件集最终事件,根据自动机逆向老化构建算法,生成当前事件对应的复杂事件的二进制编码;然后再与已有规则进行匹配,从事件编码终点开始与规则终点开始,逆向匹配已有规则;再根据本系统提出的自动机相似度距离算法,该算法通过计算二进制串对应属性位而生成差异向量,根据此向量及向量各值权重能够计算出一种二字符串之间的类欧式距离,最终能够求解与已有规则的距离,进而得到阈值距离范围内的匹配规则集,该规则集为当前事件所触发规则集合,即冲突规则集。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中金金融认证中心有限公司,未经中金金融认证中心有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201010560989.3/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种玉米收获机籽粒输送升运装置
- 下一篇:移动设备的壳体