[发明专利]一种基于并存率与关联规则的心理行为分析方法有效
申请号: | 201811040645.2 | 申请日: | 2018-09-07 |
公开(公告)号: | CN109344235B | 公开(公告)日: | 2021-07-16 |
发明(设计)人: | 宋耀莲;田榆杰;武双新;王慧东;徐文林 | 申请(专利权)人: | 昆明理工大学 |
主分类号: | G06F16/332 | 分类号: | G06F16/332 |
代理公司: | 暂无信息 | 代理人: | 暂无信息 |
地址: | 650093 云*** | 国省代码: | 云南;53 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 并存 关联 规则 心理 行为 分析 方法 | ||
本发明涉及一直基于并存率与关联规则的心理行为分析方法,属于数据关联规则挖掘技术领域。先建立一个人类心理行为词汇数据的事务数据库;然后求出各心理行为词汇并存项的并存率与最小并存率,从而保留强关联项并生成新的事务集;接着,将新事务集中每个心理行为词汇作为一个项,引入关联规则算法计算出不同项数的频繁项集;其次,由各频繁项集产生相应的强关联规则,并计算出各强关联规则的置信度大小;最后,通过各强关联规则的置信度大小,将这些频繁项集进行排序,结果将能直观表示出各心理行为词汇的关联程度。本发明提供了并存率对关联规则算法进行数据优化,通过优化后的关联规则算法对人类的心理行为词汇起到关联分析作用。
技术领域
本发明涉及一直基于并存率与关联规则的心理行为分析方法,属于数据关联规则挖掘技术领域。
背景技术
关联规则最初提出的动机是针对购物篮分析(Market Basket Analysis)问题提出的。1993年,Agrawal等人在首先提出关联规则概念,同时给出了相应的挖掘算法AIS,但是性能较差。1994年,他们建立了项目集格空间理论,并依据上述两个定理,提出了著名的Apriori算法,至今Apriori仍然作为关联规则挖掘的经典算法被广泛讨论,以后诸多的研究人员对关联规则的挖掘问题进行了大量的研究。
该算法已经被广泛的应用到商业、网络安全等各个领域,但还没有应用到心理行为关联分析领域。同时,算法对数据并没有进行预处理操作,导致结果不够精确,本发明所提出的并存率就是用来过滤无用或干扰的数据,从而得出更加准确、显著的关联规则。
发明内容
本发明要解决的技术问题是提供一直基于并存率与关联规则的心理行为分析方法,将关联规则算法进行优化后应用到相关心理行为词汇分析中,为心理学、微表情等学科提供了更加精准、高效的心理行为关联分析方法。
本发明的技术方案是:一种基于并存率与关联规则的心理行为分析方法,具体步骤为:
Step1、建立人类心理行为词汇数据的事务数据库,心理测试者的编号作为标识符tid,每一测试者的所有心理行为词汇作为一个事务T,所有事务的集合为事务集D;
Step2、扫描事务集D,每个心理行为词汇作为一个项,计算每个项的并存率ρ与它们的和,从而求出最小并存率阈值min_com,保留ρ≥min_com的心理行为词汇项,否则作为噪声剔除,再将所有保留项放入新的事务集D1中;
Step3、扫描新事务集D1,每个心理行为词汇作为一个候选1项集c1,所有c1的集合为C1,设置一个最小支持度阈值min_sup,当c1的支持度计数support_count(c1)大于等于min_sup时,则c1成为频繁1项集l1,所有l1的集合为L1,通过将L1与自身相连接产生候选2项集c2,所有c2的集合为C2,如果C2中第i个候选2项集c2(i)的某个子集为第x个候选1项集c1(x),且它不是L1的元素时,则将c2(i)从C2中删除;满足min_sup的c2作为频繁2项集l2,其集合为L2;依次循环类推,得到不同频繁项集l2、l3、……lk-1、lk的集合L2、L3……Lk-1、Lk,其中lk-1、lk分别代表频繁k-1项集和频繁k项集,Lk-1、Lk则为它们各自的集合;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于昆明理工大学,未经昆明理工大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201811040645.2/2.html,转载请声明来源钻瓜专利网。