[发明专利]基于BIDE算法与最长公共子序列的序列型数据同一鉴定系统及方法在审
申请号: | 201710159967.8 | 申请日: | 2017-03-17 |
公开(公告)号: | CN106951510A | 公开(公告)日: | 2017-07-14 |
发明(设计)人: | 刘延华;郭文忠;陈国龙 | 申请(专利权)人: | 福州大学 |
主分类号: | G06F17/30 | 分类号: | G06F17/30 |
代理公司: | 福州元创专利商标代理有限公司35100 | 代理人: | 蔡学俊 |
地址: | 350108 福建省福州市*** | 国省代码: | 福建;35 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 bide 算法 最长 公共 序列 数据 同一 鉴定 系统 方法 | ||
1.一种基于BIDE算法与最长公共子序列的序列型数据同一鉴定系统,其特征在于:该系统包括用户行为模式的数据挖掘模块、基于BIDE算法的频繁序列行为模式挖掘模块、数字证据的同一鉴定模块、基于最长公共子序列的模式相似度计算模块;其中,所述用户行为模式的数据挖掘模块,用以利用数据挖掘技术建立用户频繁行为模式库;所述基于BIDE算法的频繁序列行为模式挖掘模块,用以利用BIDE频繁闭序列挖掘算法来进行用户频繁行为模式的挖掘,获得与完整频繁序列模式信息等同的精简频繁闭合序列模式,为数据鉴定提供用户频繁序列行为模式库;所述数字证据的同一鉴定模块,用以采用同一鉴定的技术方法判定两份证据数据是否来自于同一犯罪嫌疑人或同一系统;所述基于最长公共子序列的模式相似度计算模块,用于计算两个行为模式中所有两两频繁序列之间的LCS,并结合LCS的长度和对应频繁序列的支持度来计算两个频繁序列行为模式的综合相似度。
2.一种基于BIDE算法与最长公共子序列的序列型数据同一鉴定方法,其特征在于:包括以下步骤:
步骤S1:利用数据挖掘技术建立用户频繁行为模式库,建立基于用户行为模式的数字证据同一鉴定模型;
步骤S2:采用BIDE频繁闭序列挖掘算法进行用户频繁行为模式的快速挖掘;获得与完整频繁序列模式信息等同的精简频繁闭合序列模式;
步骤S3:采用基于最长公共子序列的用户行为模式综合相似度计算方法,进行数据鉴定分析。
3.根据权利要求2所述的一种基于BIDE算法与最长公共子序列的序列型数据同一鉴定方法,其特征在于:所述步骤S1中,利用数据挖掘技术建立用户频繁行为模式库时,用户行为模式挖掘模型基本处理过程包括如下步骤:
步骤S11:利用取证工具与数据采集Agent从用户主机、网络服务器和网络设备等获取原始的用户使用数据,存储为用户原始数据集;
步骤S12:根据取证要求,对原始数据进行预处理操作,并按用户ID、用户IP、主机名或MAC地址进行分类,存储为用户数据集;
步骤S13:从用户数据库中抽取个人数据集,根据应用需求,按会话、时间段或服务单元为单位对用户数据进行划分,构造用户数据的事务集;
步骤S14:调用给定的频繁行为模式挖掘算法,对用户数据事务集进行模式挖掘,得到表征用户行为模式的频繁序列集,生成该用户的频繁行为模式;
步骤S15:返回步骤S1,重复上述步骤,生成所有用户的频繁行为模式,生成频繁行为模式数据库。
4.根据权利要求3所述的一种基于BIDE算法与最长公共子序列的序列型数据同一鉴定方法,其特征在于:所述频繁行为模式挖掘算法包括序列模式挖掘算法与非序列模式挖掘算法。
5.根据权利要求2所述的一种基于BIDE算法与最长公共子序列的序列型数据同一鉴定方法,其特征在于:所述步骤S3中,用户行为模式综合相似度计算方法包括基于全序列的比较法与基于LCS的相关函数比较法,通过计算两个行为模式中所有两两频繁序列之间的LCS,并结合LCS的长度和对应频繁序列的支持度来计算两个频繁序列行为模式的综合相似度。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于福州大学,未经福州大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201710159967.8/1.html,转载请声明来源钻瓜专利网。
- 上一篇:自体骨粉碎收集装置
- 下一篇:一种文本聚类方法及装置