[发明专利]用于挖掘中医证型关联证素的Apriori算法的改进方法在审
申请号: | 201810432357.5 | 申请日: | 2018-05-08 |
公开(公告)号: | CN108735300A | 公开(公告)日: | 2018-11-02 |
发明(设计)人: | 李月军 | 申请(专利权)人: | 西京学院 |
主分类号: | G16H50/70 | 分类号: | G16H50/70 |
代理公司: | 西安智大知识产权代理事务所 61215 | 代理人: | 何会侠 |
地址: | 710123 *** | 国省代码: | 陕西;61 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 用于挖掘中医证型关联证素的Apriori算法的改进方法,其步骤为包括定义性质、数据库中有k个事务项集,即|D|=k,每个事务都有唯一的TID作标记,设置最小支持度计数为min_sup;建立事务编码矩阵,增加删除标记DelTag,纵向统计得到修改后的事务编码矩阵的项同时为“1”的个数计算项集的支持度,与min_sup比较,产生频繁2‑项集L2、发现频繁项集、将事务编码矩阵中的事务Tk‑1的DelTag改为0,扫描数据库计算项集支持度,与min_sup比较,产生频繁项集LCount1、根据性质4,频繁项集LCount1中的项集总数是否大于k+1,如果大于,则存在LCount1+1算法继续;如果小于,则LCount1+1不存在算法结束;本发明具有提高效率的优点。 | ||
搜索关键词: | 编码矩阵 频繁项集 事务 中医证型 支持度 算法 关联 扫描数据库 最小支持度 个数计算 挖掘 计算项 删除 改进 数据库 统计 发现 | ||
【主权项】:
1.用于挖掘中医证型关联证素的Apriori算法的改进方法,其特征在于,其步骤为:步骤一:数据库中有k个事务项集,即|D|=k,每个事务都有唯一的TID作标记,设置最小支持度计数为min_sup;步骤二,建立事务编码矩阵,增加删除标记DelTag,其初始值均为1,通过对事务编码矩阵的纵向统计每项“1”的个数计算项集的支持度,与min_sup比较,产生频繁项集L1,由L1得到的项序列I1;根据性质:事务集合中项数若少于k,则无法产生频繁k‑项集,修改事务编码矩阵,即横向统计“1”的个数是1<2,将其DelTag改为0,得到修改后的事务编码矩阵;纵向统计得到修改后的事务编码矩阵的项同时为“1”的个数计算项集的支持度,与min_sup比较,产生频繁2‑项集L2步骤三:发现频繁项集对频繁项集Lk‑1中各项集进行0、1编码,然后将各项集进行“或”运算,统计生成的二进制编码中“1”的个数Count1,再统计各项集出现的次数,根据统计值及性质:在Lk‑1自连接生成候选k项集Ck时,Ck中的每个项集重复出现次,确定候选项集CCount1;步骤四,将事务编码矩阵中的事务Tk‑1的DelTag改为0,扫描数据库计算项集支持度,与min_sup比较,产生频繁项集LCount1步骤五,根据性质:如果频繁项集Lk的项集总数小于k+1,那么频繁(k+1)‑项集不存在;,频繁项集LCount1中的项集总数是否大于k+1,如果大于,则存在LCount1+1算法继续;如果小于,则LCount1+1不存在算法结束。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于西京学院,未经西京学院许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201810432357.5/,转载请声明来源钻瓜专利网。
- 上一篇:一种避孕方法知情选择筛查系统
- 下一篇:医疗随访方法、装置以及电子设备