[发明专利]一种基于贝叶斯网络的健康大数据抽验系统及方法在审
申请号: | 202110213684.3 | 申请日: | 2021-02-23 |
公开(公告)号: | CN112818373A | 公开(公告)日: | 2021-05-18 |
发明(设计)人: | 杨矫云;任振宇;王俊达;李廉 | 申请(专利权)人: | 合肥工业大学 |
主分类号: | G06F21/60 | 分类号: | G06F21/60;G06F21/62;G06F21/64;G06N7/00 |
代理公司: | 北京海虹嘉诚知识产权代理有限公司 11129 | 代理人: | 何志欣 |
地址: | 230009 *** | 国省代码: | 安徽;34 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 贝叶斯 网络 健康 数据 抽验 系统 方法 | ||
1.一种基于贝叶斯网络的健康大数据抽验系统,所述系统至少包括抽验模块,其特征在于,
所述抽样模块基于卡方检验来检测从原始数据集抽取的至少一个子数据集,并且基于卡方检验结果和与其连接的终端的预设条件来向所述终端发送匹配的子数据集,其中,
所述子数据集是由所述抽样模块以启发式抽样的方式从原始数据集中抽取的。
2.根据权利要求1所述的基于贝叶斯网络的健康大数据抽验系统,其特征在于,所述抽验模块基于卡方检验来检测所述子数据集至少一个属性的条件概率分布。
3.根据权利要求2所述的基于贝叶斯网络的健康大数据抽验系统,其特征在于,
在终端向抽验模块请求与原始数据集的联合概率分布具有同一性的至少一个子数据集的情况下,
所述抽验模块以启发式抽样的方式抽取满足联合概率分布的至少一个子数据集。
4.根据权利要求2所述的基于贝叶斯网络的健康大数据抽验系统,其特征在于,
在终端向抽验模块请求与原始数据集的联合概率分布不具有同一性的至少一个子数据集的情况下,
所述抽验模块随机抽取不满足联合概率分布的至少一个子数据集。
5.根据权利要求1~4任一项所述的基于贝叶斯网络的健康大数据抽验系统,其特征在于,
所述抽验数据系统还包括存储原始数据集的原始数据库和贝叶斯网络模块,
所述抽样模块从原始数据集抽取子数据集的方式包括:
计算与原始数据集对应的贝叶斯网络的参数θijk和ηijk,
以第三评分函数和/或第四评分函数为目标函数抽取出评分最好的子数据集增量,将子数据集增量并入子数据集中;
基于第一评分函数对子数据集进行卡方检验,
基于卡方检验的结果以及抽取预设条件输出抽取的子数据集。
6.根据权利要求5所述的基于贝叶斯网络的健康大数据抽验系统,其特征在于,所述计算与原始数据集对应的贝叶斯网络的参数θijk和ηijk的方式为:
通过对贝叶斯网络模型中的父结点集合的取值进行编码以获取父结点的mijk,
其中,mijk表示原始数据集D中结点xi取第k种取值且其父结点集合π(xi)取第j种取值的数量,i表示贝叶斯网络中第i个结点xi,j表示π(xi)的第j种取值,k表示结点xi的第k种取值。
7.根据权利要求5所述的基于贝叶斯网络的健康大数据抽验系统,其特征在于,计算与原始数据集对应的贝叶斯网络的参数θijk和ηijk的方式还包括:
θijk=P(xi=k|π(xi)=j),
ηijk=P(xi=k,π(xi)=j),
其中,i表示贝叶斯网络中第i个结点xi,j表示π(xi)的第j种取值,k表示结点xi的第k种取值,π(xi)表示结点xi的父结点的结合。
8.根据权利要求7所述的基于贝叶斯网络的健康大数据抽验系统,其特征在于,基于遗传算法以第三评分函数和/或第四评分函数为目标函数抽取出评分最好的子数据集增量的方式包括:
基于第三评分函数和/或第四评分函数检测子数据集的未通过卡方检验的结点数量和/或评分值的增加程度;其中,
第三评分函数表示并入子数据集增量后形成的子数据集未通过卡方检验的结点数量;
第四评分函数表示并入子数据集增量后形成的子数据集的评分值的增加程度。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于合肥工业大学,未经合肥工业大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110213684.3/1.html,转载请声明来源钻瓜专利网。
- 上一篇:风力发电机组
- 下一篇:一种接口测试脚本生成方法、装置、计算机设备和介质