[发明专利]基于贝叶斯网络的个人数据分析方法及计算机存储介质有效
申请号: | 201811596679.X | 申请日: | 2018-12-26 |
公开(公告)号: | CN109697512B | 公开(公告)日: | 2023-10-27 |
发明(设计)人: | 吕建华;张柏礼 | 申请(专利权)人: | 东南大学 |
主分类号: | G06N7/01 | 分类号: | G06N7/01;G06N5/04;G06N3/126 |
代理公司: | 南京苏高专利商标事务所(普通合伙) 32204 | 代理人: | 柏尚春 |
地址: | 210000 *** | 国省代码: | 江苏;32 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 贝叶斯 网络 个人 数据 分析 方法 计算机 存储 介质 | ||
1.一种基于贝叶斯网络的个人数据分析方法,其特征在于包括以下步骤:
(1)将个人生活行为数据具体化为行为和行为属性的一维向量,行为属性中至少包含时间属性,经过数据预处理,得到生活行为数据记录;
(2)通过混合结构学习算法对数据进行学习,构建生活数据贝叶斯网络;
(3)根据步骤(2)中的生活数据贝叶斯网络进行参数学习,学习得到每个网络节点的条件概率分布表;
(4)根据步骤(2)中的生活数据贝叶斯网络,使用联合树推理算法,基于特定行为的概率计算其他行为发生的概率,完成个人生活行为分析预测。
2.根据权利要求1所述的基于贝叶斯网络的个人数据分析方法,其特征在于:步骤(1)中的行为属性包括行为主体、时间、地点、环境、状态、客体和结果。
3.根据权利要求1所述的基于贝叶斯网络的个人数据分析方法,其特征在于:步骤(2)中的生活数据贝叶斯网络构建过程为:
(21)选定行为作为节点,根据行为之间的逻辑关系及时序关系进行网络的初始化,得到一个有向无环网络;
(22)通过最大信息系数来衡量网络中两个节点Xi与Xj的关联程度,进行初始化,得到一个单连通网络;
(23)通过条件互信息进行条件独立性检测,对步骤(22)中的单连通网络进行增厚,得到无向网络S;
(24)在保证无向网络S连通性的前提下,进行条件独立性检测,进行网络中的冗余边去除;
(25)利用BDe评分函数和贪婪搜索算法进行结构学习,得到评分最优的网络结构。
4.根据权利要求3所述的基于贝叶斯网络的个人数据分析方法,其特征在于:步骤(22)中进行初始化的过程为,计算每个节点Xi与其他节点的最大信息化系数MIC,找出其最大值MMIC(Xi),找出满足MICδ(Xi,Xj)≥αMMIC(Xi)或者MICδ(Xi,Xj)≥αMMIC(Xj)的边(Xi,Xj),并将满足要求的边加入序列L,对序列进行降序排列,若Xj和Xj之间不存在边,则添加边,如此重复,构造一个单连通网络,其中阈值因子α=0.8。
5.根据权利要求3所述的基于贝叶斯网络的个人数据分析方法,其特征在于:步骤(23)中所述的网络增厚的方法为:对于每对顶点(Xi,Xj),找出与节点Xi相连的节点集合N1以及与Xj相连的节点集合N2,通过dSeparateA函数对N1和N2进行D-separate检测,若不满足条件独立性,则在两点之间添加一条边,如此反复,完成网络增厚;步骤(24)中所述的冗余边去除的方法为:找出与N1相连的节点集N1’以及与N2相连的节点集N2’,对集合N1+N1’和N2+N2’进行D-separate检测,若满足条件独立性,则删除两点之间的边,如此反复,完成网络冗余边的去除。
6.根据权利要求3所述的基于贝叶斯网络的个人数据分析方法,其特征在于:步骤(25)中进行结构学习的过程为:对于与Xi相连接的每个节点Xj,计算添加边Xi→Xj之后的BDe评分,找出使评分最大化增加的边Xj→Xi,添加到贝叶斯网络中,直到评分不再增加为止;然后计算将每条边转向之后的BDe评分,对增加评分的边执行转向操作,直到评分不再增加为止。
7.根据权利要求1所述的基于贝叶斯网络的个人数据分析方法,其特征在于:步骤(3)中得到条件概率分布表的过程为将每个行为或行为/属性看作随机变量θ,根据已有数据计算其先验概率P(θ),得到每个节点的条件概率分布表。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于东南大学,未经东南大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201811596679.X/1.html,转载请声明来源钻瓜专利网。