[发明专利]一种面向多源异构数据的云推送方法有效
申请号: | 201610077551.7 | 申请日: | 2016-02-03 |
公开(公告)号: | CN105760449B | 公开(公告)日: | 2018-11-30 |
发明(设计)人: | 肖刚;陆佳炜;王辰昊;张元鸣;陈烘;李杰 | 申请(专利权)人: | 浙江工业大学 |
主分类号: | G06F17/30 | 分类号: | G06F17/30 |
代理公司: | 杭州斯可睿专利事务所有限公司 33241 | 代理人: | 王利强 |
地址: | 310014 浙江省杭州市*** | 国省代码: | 浙江;33 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 一种面向多源异构数据的云推送方法,针对多源异构数据的特征,综合移动互联网安全性和隐私性等特点,来计算分布式环境中多源异构数据的特征值和特征向量,用于快速分离数据源中的同构数据和异构数据,利用云推送技术来实现同构数据和异构数据的自动分离和高效推送。本发明通过设计多维决策云推送模型,使云推送不仅减少了数据推送更新过程中的同步数据量,缩短了时间,而且解决了多源异构数据的跨平台的推送的问题,特别针对数据量巨大,且工作在低带宽,网络不可靠的情况下工作效率有明显提升。 | ||
搜索关键词: | 一种 面向 多源异构 数据 推送 方法 | ||
【主权项】:
1.一种面向多源异构数据的云推送方法,其特征在于:所述云推送方法包括如下步骤:第一步:设计云推送平台,过程如下:1.1云推送平台推送三种类型的消息:通知、透传消息及富媒体;1.2云推送平台同时应支持向所有用户或根据标签分类向特定用户群体推送消息,根据用户订阅的消息内容,将用户分组,给分组用户不同的标签,根据不同的标签,进行相应内容的推送,对单个用户进行单个标签,最终根据标签内容进行推送;1.3云推送平台提供用户信息及通知消息统计信息,根据用户的反馈信息统计信息留存率,通信率和流量消耗;1.4云推送平台跨平台使用,用户根据自己的需要添加自定义功能;第二步:多源异构数据的采集,过程如下:2.1将环境中不同系统中的多源异构数据视为云数据,根据系统给予的不同权值,将云数据分类为不同的模块,包括通知模块,富媒体模块和透传消息模块;2.2云推送平台根据用户订阅的模块信息进行管理,根据不同用户订阅的模块,将用户进行分组,具有相同模块的用户为同组并贴上标签,同时管理注册用户的信息;2.3云推送服务器对云数据信息进行管理,将信息按照时间进行管理,记录下每次更新的数据,以便下一步推送时使用;2.4云推送平台对(2.3)中的更新信息进行预处理,将数据格式相同,权值相同的分成不同分组,方便同构数据和异构数据的分离,MDCP模型将访问信息库的数据,通过确定权值和属性分离进行决策推送,即为整个“订阅‑收集‑决策‑推送”周期;第三步:信息收集完成后,需要MDCP模型对云数据进行分离,分为多源异构数据和多源同构数据,过程如下:3.1多源异构数据成分分析利用这些分布在不同云服务器上的异构数据来得到数据的主成分,通过每个主要数据成分值Xi与给出的μ相减即为该成分在μ的向量方向上的偏移值,将每个主要数据成分值Xi填入矩阵S中,i=1,2...N;S=[X1,X2,X3,...,XN] (1)再将矩阵S乘以它的对角矩阵ST后求和再取平均,由于该矩阵乘以它的对角矩阵后得到的为确定的数值,所以该值用来表示整体的异构程度,用V表示:
其中μ是根据评估得出的权重值,根据不同的系统得到其取值范围,N为样本总量,由于此时V为确定的数值,该样本的异构程度可用特征值V表示;如果出现多源异构数据需要推送,此时每个数据的主成分不能分为X1~XN,此时需要Xi变为Xij,所以矩阵S变为:
此时,V为矩阵,视为特征矩阵,所以V乘以它的对角矩阵,即可推出云数据的特征值k:|V‑kE| (4)V给出了特征向量,通过化简求出了相应的特征值k,特征值k的大小和V共同度量了不同云数据的异构程度;3.2多源同构数据的推送,过程如下:首先,用第一个云数据站点上的样本估计局部方差和均值向量μ1,再取得第二个云数据站点上的样本估计局部方差和均值向量μ2,直到得到所有云数据站点的样本NK,在局部方差和均值向量的规定范围内,则认为是这些云数据站点提供的是同构数据,求出平均均值向量
再通过
求出平均参数协方差:![]()
由于是同构数据,次增量更新方程为:![]()
其中,K=1,2,3.....,在推送过程中,同构数据每次更新,只需要传输半个协方差矩阵,MDCP模型使用基于WebSocket的MQTT进行推送,若系统数目为M,参数个数为d,时间复杂度为:O(M,d)=(M‑1)(d(d+1)/2+d+1);3.3多源异构数据的推送多源异构数据是对同构数据主要成分进行扩展,引入置换矩阵P,对云服务器上取得的样本进行置换映射,结果记为y,即:y=(ya,yb)t=PmX (9)将当前样本中和同构数据中相同的部分集中到向量的前面,用ya表示,而将不同的部分放置在向量的后面,用yb表示,同样,对均值矩阵和协方差矩阵进行置换,结果分别记为
∑:
μ和置换矩阵都是上一次计算得出的量,Σa是在m样本中已经得到的协方差矩阵,Σc是与同构数据中不同元素的协方差矩阵,而Σb是他们之间协方差构成的矩阵;云数据样本采用高维分布计算,其表达式如下:
y,μ,∑通过(5)(9)(10)3个公式带入进行简化,并取自然对数得
再求偏导,化简后得:
其中第一行是与同构数据相同的元素项,已经在公式(10)中计算出来,第二行就是异构数据,所以信息源更新后推送异构数据的公式即为:
3.4 MDCP模型运行流程,当得到需要推送的任务之后,调用MDCP模型,当消息进入推送列表时,MDCP模型通过特征值计算分离出多源同构数据和多源异构数据,首先对云数据进行权值的确定,权值的大小由系统根据属性的重要程度进行分配,再将属性根据权值进行分离,若是多源同构数据,则使用第三方推送方式,若是多源异构数据则使用MQTT推送,若无法推送,则重新进入等待通道;根据周期的循环性,将MDCP模型用于筛选出重复数据和变化数据信息,再根据特征向量区分出多源同构数据还是多源异构数据,最后根据用户订阅的系统的数量,网络的带宽,推送的数据的数量以及保密性综合判断所使用的推送方式。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于浙江工业大学,未经浙江工业大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201610077551.7/,转载请声明来源钻瓜专利网。
- 数据显示系统、数据中继设备、数据中继方法、数据系统、接收设备和数据读取方法
- 数据记录方法、数据记录装置、数据记录媒体、数据重播方法和数据重播装置
- 数据发送方法、数据发送系统、数据发送装置以及数据结构
- 数据显示系统、数据中继设备、数据中继方法及数据系统
- 数据嵌入装置、数据嵌入方法、数据提取装置及数据提取方法
- 数据管理装置、数据编辑装置、数据阅览装置、数据管理方法、数据编辑方法以及数据阅览方法
- 数据发送和数据接收设备、数据发送和数据接收方法
- 数据发送装置、数据接收装置、数据收发系统、数据发送方法、数据接收方法和数据收发方法
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置