[发明专利]一种基于数据挖掘技术的用户行为分析系统及方法在审
申请号: | 202110260276.3 | 申请日: | 2021-03-10 |
公开(公告)号: | CN112990291A | 公开(公告)日: | 2021-06-18 |
发明(设计)人: | 胡旭光;李正;马大中;胡旌伟;孙秋野;李希博;王鹏程;李程晨;王雷 | 申请(专利权)人: | 东北大学 |
主分类号: | G06K9/62 | 分类号: | G06K9/62 |
代理公司: | 沈阳东大知识产权代理有限公司 21109 | 代理人: | 李珉 |
地址: | 110819 辽宁*** | 国省代码: | 辽宁;21 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 数据 挖掘 技术 用户 行为 分析 系统 方法 | ||
1.一种基于数据挖掘技术的用户行为分析系统,其特征在于,包括温度数据采集单元、手机控制终端以及服务器端;
所述温度数据采集单元由单片机、温度传感器、Wi-Fi通信模块和电源模块构成,单片机与温度传感器连接,接收到手机控制终端的唤醒命令后,通过I2C总线协议从温度传感器读取温度数据,通过Wi-Fi通信模块发送给手机控制终端,电源模块是单节锂聚合物电池和稳压芯片,分别与单片机、温度传感器、Wi-Fi通信模块的电源接口连接;
所述手机控制终端为用户行为特征提取单元,通过Wi-Fi通信模块与温度数据采集单元通信,获取实时温度数据,对温度数据进行加工,添加对应的时间、GPS方位、当前天气温度数据等数据,并对温度数据进行中位值平均滤波处理,通过分布式存储技术分割存储,并将数据经手机上传至服务器端;
所述服务器端包括用户群体分类单元、关联因素辨识及综合应用单元;所述用户群体分类单元结合基于时间序列的数据挖掘技术,对上传服务器端的不同时间、地点、天气下温度采集单元采集到的温度信息进行分类,建立用户分类模型;所述关联因素辨识及综合应用单元对经过整理和分类的温度信息进行分析,找出用户汽车内部温度信息与时间、地点、天气之间的潜在关联因子,实现对用户行为的分析、预测和对异常行为的检测。
2.一种基于数据挖掘技术的用户行为分析方法,通过权利要求1所述一种基于数据挖掘技术的用户行为分析系统实现,其特征在于:包括以下步骤:
步骤1:手机控制终端通过测温节点采集温度信息,经过添加外部环境信息作为用户行为信息,并上传至服务器,完成基于互联网的用户行为信息数据;
步骤2:对用户行为信息数据进行预处理,对上传到服务器的基于时间序列的温度信息进行预处理和等长处理,通过时间序列上升和下降点对时间序列数据进行近似处理,
步骤2.1:对时间序列进行预处理,将时间序列数据都映射到区间[0,1]内,消除时间序列数据中存在的噪声,公式如下:
其中,x*代表的是进行转换后得到的归一化或标准化数据;max(x)代表的是时间序列中存在的最大值;min(x)代表的是时间序列中存在的最小值;
步骤2.2:提取以r为半径、o(ti,xi)为中心区域的极值点;将o(ti,xi)作为中心,时间序列点(tp,xp)依次向后或向前采集第i个时间序列点,得到r为半径、o(ti,xi)为中心的区域G(o),通过下式判断区域中存在的极值点:
其中,f(xi,1)代表的是以r为半径、o(ti,xi)为中心区域内存在的数值特征;-1、1分别代表的是区域内的极小值点和极大值点;当f(xi,1)的值为零时,表明该时间序列点不是极值点;ti代表时间序列中第i个点的对应的时间、GPS方位、天气、车外温度构成的数组,xi代表归一化处理后第i个点对应的车内温度,tp代表时间序列中第p个点的对应的时间、GPS方位、天气、车外温度构成的数组,xp代表第p个点对应的车内温度;
步骤2.3:对提取的时间序列中的极值点进行等长处理;提取两个时间序列中存在的极值点并集,重新划分具有新极值点的时间序列,使时间序列的长度相等,时间序列等长处理的具体方法如下式所示:
其中,X、Y为等长时间序列,SX、SY为极值点对应的极值点序列,长度分别为m、n,SX′、SY′为经过等长处理后的时间序列;
步骤3:对用户行为信息进行数据挖掘,将多目标决策理论应用到时间序列数据挖掘中;
步骤3.1:根据提取得到的区间极值点序列构建标准决策矩阵Z,决策矩阵Z中的行列均为时间序列中存在的极值点以及极值点对应的对象属性;设向量A={a1,…,an}是由n个极值点构成的集合;向量C={c1,…,cm}是由m个极值点属性构成的集合,即为评价指标,通过下式比较不同指标对应的决策对象:
dk(ai,aj)=ck(ai)-ck(aj)
其中,dk(ai,aj)代表的是在评价指标ck上极值点ai、aj存在的差值;
步骤3.2:通过偏好函数用标准化的偏好度πk(ai,aj)代替差值dk(ai,aj),方法为:
πk(ai,aj)=fk(dk(ai,aj))
其中,fk()代表的是偏好函数;
步骤3.3:基于多目标决策的时间序列数据挖掘算法在线性特征的基础上对偏好函数进行选择,如下式所示:
其中,pk代表的是偏好阈值;qk代表的是无差异阈值;上述两个阈值可以对偏好度的分布态势进行预测;dk(ai,aj)在评价指标ck上极值点ai、aj存在的差值;
步骤3.4:确定目标的正负偏好;决策对象a和决策对象b之间存在的多目标偏好度如下式所示:
正偏好流和负偏好流的计算公式分别如下:
其中,代表的是正偏好流,在全部决策目标上决策对象ai的正偏好流对应的偏好级别最高;代表的是负偏好流,在全部决策目标上决策对象ai的负偏好流对应的偏好级别最低;
步骤3.5:最优决策对象在极端情况下对应的负偏好流值和正偏好流的值分别为0和1;基于多目标决策的时间序列数据挖掘算法根据偏好流排序结果实现时间序列数据挖掘,净偏好流的值越大表明极值点对应的偏好级别越高,根据级别对时间序列数据进行分类,实现时间序列的数据挖掘,净偏好流计算如下式:
步骤4:利用云、边协同计算方法,将边缘端服务器和云端服务器进行协同作业;提高用户行为分析的执行效率,从整体上提高任务处理的速度;
步骤4.1:通过云端服务器集群组成的云端部件和边缘服务器集群组成的边缘部件的任务是否有相互干扰和数据往来,将云边协同模式分为三类任务:云边相离类任务、云边相交类任务以及云边包含类任务;
其中云边相离类任务为云端部件和边缘端部件中的任务没有数据往来,云边相交类任务为云端部件与边缘端部件中的任务有数据交换,云边包含类任务为云端部件中的任务是边缘端部件中任务的子任务;
步骤4.2:将云端服务器和边缘端服务器上的DAG(Directed acyclic graph:DAG)进行合并,如下式所示:
其中,A、B为集合1、集合2,C为合并后的集合;式①表示对于云边相离任务,合并的方法是增加一个虚拟的入口任务节点和出口任务节点,然后更新虚拟入口任务节点和出口任务节点;式②表示对于云边相交任务,合并的方式是入口任务节点同时作为每个子DAG入口任务节点的父亲节点,然后以替换的方法实现DGA合并;式③表示对于云边包含任务,通过判断较大任务节点来替代小任务节点实现合并;
步骤4.3:利用基于关键路径的分割策略划分任务,分割方法如下式所示:
其中,CTS(Critical tasks set)表示关键任务集,NCTS(Non-critical tasks set)非关键任务集,其中任务集类型分为边缘端任务EST(Edge-side tasks)和云端任务CST(Cloud-side tasks);
步骤4.4:根据DAG合并图关键路径的边的权值之和确定云边协同计算架构下任务图的优先级,云边协同计算架构下DAG合并图Dk的优先级rank(Dk)方法如下式所示:
其中n*表示任务个数;
步骤4.5:从任务图列表中具有较高优先级的任务图开始优先分配处理器资源,根据任务图列表构成相应的路径列表,路径pk的优先级rank(pk)如下式所示:
ηi代表任务图列表对应的路径值,ei代表该路径的权值;
步骤5:对用户行为隐私保护,对对称密钥进行加密保护,消息订阅者正确解密并得到正确的对称密钥,进而解密并恢复出元数据M,实现对用户行为的分析、预测和对异常行为的检测。
3.根据权利要求2所述的一种基于数据挖掘技术的用户行为分析方法,其特征在于,步骤5具体包括:
步骤5.1:数据安全分享的初始化算法;首先选择两个双线性群G0(阶为p,生成元为g)和G1,并且定义一个双线性映射e:G0×G0=G1;另外,选择两个安全哈希函数H1(·),H2(·)和访问参数α,β1,β2∈Zp使得α≠0,β1≠0,,β2≠1且β2≠β1,公开密钥为:
主密钥MSK为:
MSK={β1,β2,gα}
步骤5.2:数据安全分享的密钥生成算法;设S表示一个数据订阅者的属性集合,属性授权端首先选择然后为每个订阅者产生私钥SK,公式如下所示:
步骤5.3:发布者对终端进行加密;执行一个具有签名策略的密钥产生算法,并且获得一个一次密钥对(sk,vk),根据消息内容构建一个访问树Γ=ΓuANDtc作为该消息的访问控制策略,然后计算K=e(g,g)αs,对称密钥ek=H2(K)和用对称密钥ek对明文M进行对称加密得到C=Enc M,最后输出密文Cu,Cu计算公式如下:
Cu={Γ,C,C1}
步骤5.4:订阅者终端解密,当消息订阅者从网络中获取了其感兴趣的数据包之后,如果他的属性集满足该数据包的树形访问结构u,用验证密钥在密文上验证签名通过,并用对称密钥ek解密得到明文元数据M。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于东北大学,未经东北大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110260276.3/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种抗拉纤维锚杆杆体及锚杆
- 下一篇:一种用于摄像装置的视频编码方法及装置
- 数据显示系统、数据中继设备、数据中继方法、数据系统、接收设备和数据读取方法
- 数据记录方法、数据记录装置、数据记录媒体、数据重播方法和数据重播装置
- 数据发送方法、数据发送系统、数据发送装置以及数据结构
- 数据显示系统、数据中继设备、数据中继方法及数据系统
- 数据嵌入装置、数据嵌入方法、数据提取装置及数据提取方法
- 数据管理装置、数据编辑装置、数据阅览装置、数据管理方法、数据编辑方法以及数据阅览方法
- 数据发送和数据接收设备、数据发送和数据接收方法
- 数据发送装置、数据接收装置、数据收发系统、数据发送方法、数据接收方法和数据收发方法
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置