[发明专利]基于深度贝叶斯网络的公共数字生活场景规则模型预测预警方法有效
申请号: | 202110292515.3 | 申请日: | 2021-03-18 |
公开(公告)号: | CN113010572B | 公开(公告)日: | 2023-04-18 |
发明(设计)人: | 马汉杰;董慧;许永恩;刘烈宏;李柏睿 | 申请(专利权)人: | 杭州码全信息科技有限公司 |
主分类号: | G06F16/2458 | 分类号: | G06F16/2458;G06F16/28;G06F40/216;G06F40/289;G06F40/30;G06V40/16;G06V10/82;G06N3/045;G06N3/042;G06N3/0464;G06N3/08;G06N7/01;G06Q10/0635;G06 |
代理公司: | 杭州天勤知识产权代理有限公司 33224 | 代理人: | 王琛 |
地址: | 310018 浙江省杭州*** | 国省代码: | 浙江;33 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 深度 贝叶斯 网络 公共 数字 生活 场景 规则 模型 预测 预警 方法 | ||
1.一种基于深度贝叶斯网络的公共数字生活场景规则模型预测预警方法,包括如下步骤:
(1)通过物联网、应用端、业务系统三种接入途径获取海量多源异构数据,并建立数据库;
(2)对数据库进行分层,构建人、企、地、事、物五个基础要素主题库;
(3)采用批流式大数据实时处理技术对多源异构数据进行处理;
所述批流式大数据实时处理技术包括了数据采集、数据加载、数据总线、数据分析、业务服务五个功能模块,数据采集模块负责使用物联网采集、应用端采集的方式实时接入流数据;数据加载模块负责加载历史离线数据以及从业务系统中接入流数据;数据总线模块负责将各类数据按照统一的格式放入指定通道进行传输;数据分析模块负责对实时数据进行抽取、加工和产品数据的推送服务;当收到业务系统发出的实时查询请求时,数据分析模块能够利用内部的分析处理模型在完整大数据集上实时计算出相应的指标并进行判断,将结果通过业务服务模块反馈给业务系统;
(4)将上述五个基础要素主题库与具体的应用场景相结合,构建具体应用场景下用户数字画像的五个维度:人口属性、生活属性、社交属性、消费特征、心理属性;
所述人口属性用于描述用户社会层面基本特征信息,帮助各个重点生活应用场景了解用户的基本情况;所述生活属性用于了解用户的生活状况,包括生活活动范围和出行方式,以便后续给用户提供精准的服务;所述社交属性用于描述用户的社交图谱、家庭成员、朋友圈、兴趣爱好,这些信息往往代表用户的社会关系网,通过社交信息可以尽可能完整地了解用户,以便为用户提供个性化的服务;所述消费特征用于描述用户主要消费习惯和消费偏好,用于挖掘相关消费服务的潜在用户,依据用户消费特点推荐相关产品和服务,提高推荐转化率;所述心理属性用于关注用户的心理状况信息,通过匿名问卷调查或相似用户聚类的方式获取用户心理情况,根据其心理状况提供相应的心理服务或进行重点关注;
(5)根据处理过后的多源异构数据,通过数据挖掘分析用户标签构建用户数字画像;
针对多源异构数据中的非视频数据和视频数据,分别采用基于原始数据挖掘的用户标签构建方式以及基于视频结构化技术的用户标签构建方式;对于非视频数据,基于原始数据挖掘的用户标签构建方式融合了自然语言处理、用户意图识别、关联规则、聚类分析以及轨迹相似度五种方法;对于特定用户特定维度数据缺失的情况,则使用协同过滤算法通过对其他相似用户的分析补全特征,保证用户标签的完备性;对于视频数据,基于视频结构化技术的用户标签构建方式融合了目标检测、OpenCV+CNN情绪识别、GaitSet步态识别三种方法;
所述自然语言处理过程采用TF-IDF算法计算文本之间的相似度,进而根据相似度采用fastText分类器对文本进行归类,最后采用Word2Vec提取文本中的词向量,利用LSTM将各词向量融合成句向量并输入至预先训练好的递归神经网络或循环神经网络,从而预测分析出同类文本所展现的情感;
所述用户意图识别即根据用户的搜索记录或者已分析出的用户标签对用户的行为意图进行判断,具体实现过程中采用TF-IDF算法对数据进行向量化,利用词频、卡方和互信息的方式进行特征选择,最后采用预先训练好的决策树CART、包含多个决策树的随机森林、逻辑回归或贝叶斯模型对用户的行为意图进行判断;
所述关联规则即用于发掘表面看似无规律的数据间的关联性,从而发现数据之间的规律性和发展趋势,具体实现过程中则采用Apriori或FP-Growth算法;所述聚类分析即用于将相似的数据归为一类,原则上是使每一类数据的相似性最大,聚类作为无监督算法,适合对高维度数据进行分析;所述轨迹相似度即从时间域和空间域上分析行为轨迹,从历史行为轨迹中挖掘用户的日常行为规律和偏好,并为其打上标签;
所述OpenCV+CNN情绪识别用于检测出视频图像中人脸的表情状态,具体实现过程首先是人脸的检测与定位,然后是面部表情特征的提取,最后使用预先训练好的卷积神经网络CNN用于人脸表情的分类与判断;所述GaitSet步态识别用于检测出视频图像中人的行走姿态,具体实现过程中首先将图像输入卷积神经网络CNN中以提取特征,再集合多特征池化的方式为将图像中的特征聚合成一个特征向量,同时采用Horizontal Pyramid Pooling使得特征更具鉴别性,在预测计算上则采用双流法即包含两个通道:一个是RGB图像通道用于建模空间信息,另一个是光流通道用于RNN建模时序信息,两者联合训练并进行信息融合,最后将特征输入训练好的模型中从而实现步态识别;
(6)针对具体应用场景,利用用户数字画像信息通过对深度贝叶斯网络进行训练,得到该场景下的事件风险预测模型,进而利用该模型对目标事件存在的风险进行预测预警,具体地:
首先分析具体应用场景中的用户数字画像信息,获取事件涉及的各类信息要素以及行为要素,了解事件各要素之间的关联关系,建立基于事件信息要素和行为要素的特征样本库;然后将特征样本与专家意见相结合,确定网络节点的先验概率即风险概率的初始证据;进而将特征样本和初始证据输入到网络结构中,利用EM算法推测网络中非根节点的条件概率分布;最后基于贝叶斯算法准则,将先验概率和条件概率转化为后验概率,即目标事件发生风险的概率预测结果。
2.根据权利要求1所述的公共数字生活场景规则模型预测预警方法,其特征在于:所述步骤(1)中的多源异构数据包括结构化数据和非结构化数据,结构化数据包括了以房屋、地址等基本信息在内的基础数据以及以车辆出入信息和物联感知信息在内的扩展数据,非结构化数据包括了人员采集的生活事件信息、摄像头等设备采集的视频监控数据、音频类以及图像类数据。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于杭州码全信息科技有限公司,未经杭州码全信息科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110292515.3/1.html,转载请声明来源钻瓜专利网。