[发明专利]改进的Apriori算法及其在藏医关联挖掘中的应用在审
申请号: | 201910077414.7 | 申请日: | 2019-01-25 |
公开(公告)号: | CN109859852A | 公开(公告)日: | 2019-06-07 |
发明(设计)人: | 王璐;张磊;祝小兰;王世颍;王雪茜;刘超逸;张拂晓 | 申请(专利权)人: | 青海大学 |
主分类号: | G16H50/70 | 分类号: | G16H50/70;G16H50/20 |
代理公司: | 北京方圆嘉禾知识产权代理有限公司 11385 | 代理人: | 董芙蓉 |
地址: | 810016 *** | 国省代码: | 青海;63 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 事务数据库 布尔矩阵 向量运算 诊疗 扫描 应用 矩阵 先进科学技术 改进 关联 辅助医疗 决策分析 重复扫描 数据集 数据项 支持度 挖掘 转换 向量 事务 医学 医疗 帮助 | ||
本发明公开了一种改进的Apriori算法及其在藏医关联挖掘中的应用,只需对事务数据库扫描一次,就可将事务数据库转换成布尔矩阵,对事务数据库的扫描即可转换为向量运算。矩阵中行代表事务,列代表数据项,某项若在事务中出现则用1表示,没有出现则用0表示。布尔矩阵相对于事务数据库更加简洁,不需要重复扫描数据集,且通过向量运算计算支持度。本发明改进后的基于向量的Apriori算法明显优于原有Apriori算法。将其应用于藏医诊疗领域,辅助医疗决策分析,能够帮助藏医药工作者及时准确的获取有用信息,有效避免医疗失误,并提高藏医学的现代化水平,为运用先进科学技术辅助藏医诊疗提供一个有力的手段。
技术领域
本发明涉及一种改进的Apriori算法及其应用,具体地说,设计一种能够加速发现频繁项集的改进的Apriori算法及其在藏医关联挖掘中的应用。
背景技术
Apriori算法运用在候选项集中发现频繁项集的方式,取得了较好的性能,但仍存在效率不高的问题,运行时间主要消耗在三个方面:产生每一级频繁模式,都需要重复地扫描数据库,I/O负载沉重;当数据集较大时,产生的候选项集数目成指数级增长,计算量巨大;大量的候选项集与事务进行模式匹配时花费大量时间,得不到广泛应用,尤其是在藏医症候分型过程中的应用。
藏医药学是我国传统民族医药学宝库中一颗璀璨的明珠,在藏族人民漫长的生产、生活实践中,其系统的理论和独特的临床疗效及用药特色,为藏族人民繁衍生息、保障生命健康做出了重要贡献,也越来越受到世人的关注。对藏医药文化进行现代技术的研究是时代发展和藏医药发展的内在要求,只有将现代的信息化技术融入到藏医药的研发过程中,并运用到藏医院的实际运行中来,才能够为藏医药的可持续发展奠定良好的技术基础和环境基础。
从目前现有的针对藏医现代化方面的研究来看,主要有运用信息化技术对藏医药临床数据进行管理应用、根据临床记录数据对藏医临床进行研究分析、结合数据挖掘技术对藏医诊疗和藏药方剂配伍进行探索挖掘等成果。但由于藏医现代化事业发展起步较晚,在新形势下还面临许多新问题和困难,如藏医药名词、术语缺乏规范;临床研究层次和水平偏低;藏医诊疗技术标准化程度不高等。
发明内容
本发明的目的在于提供一种改进的Apriori算法及其在藏医关联挖掘中的应用。该方法该算法只需对事务数据库扫描一次,就可将事务数据库转换成布尔矩阵,对事务数据库的扫描即可转换为向量运算。矩阵中行代表事务,列代表数据项,某项若在事务中出现则用1表示,没有出现则用0表示。布尔矩阵相对于事务数据库更加简洁,不需要重复扫描数据集,且通过向量运算计算支持度,可明显缩短寻找频繁项集所需的时间,提高挖掘的效率。该算法针对真布病症状与症型数据集,将其应用于藏医诊疗领域,辅助医疗决策分析,以期能够帮助藏医药工作者及时准确的获取有用信息,有效避免医疗失误,并提高藏医学的现代化水平,为运用先进科学技术辅助藏医诊疗提供一个有力的手段。
其具体技术方案为:
一种改进的Apriori算法,包括以下步骤:首先将事务数据库初始化为布尔矩阵。在数据集D中,设I={i1,i2,i3…in}是项的集合,其中每个事务T是项的集合,使得对于一个给定的数据集D,都存在着f(D)=M,M定义为:
其次对于每一项支持度的计算,对每一个项Ij,都对应一个列向量Dj,定义为:
Ij的支持度计数为:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于青海大学,未经青海大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910077414.7/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种治疗方案推荐方法和装置
- 下一篇:一种大数据医疗数据管理系统