[发明专利]基于聚类算法和回声状态网络的异常消费行为检测方法在审
申请号: | 201710438150.4 | 申请日: | 2017-06-12 |
公开(公告)号: | CN107301564A | 公开(公告)日: | 2017-10-27 |
发明(设计)人: | 张各各;王辉;任宁宁;陈祥涛;周毅 | 申请(专利权)人: | 河南科技大学 |
主分类号: | G06Q30/02 | 分类号: | G06Q30/02;G06Q30/00;G06Q40/02;G06N3/04;G06N3/08;G06K9/62 |
代理公司: | 洛阳公信知识产权事务所(普通合伙)41120 | 代理人: | 刘兴华 |
地址: | 471000 河*** | 国省代码: | 河南;41 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 算法 回声 状态 网络 异常 消费行为 检测 方法 | ||
1.一种基于聚类算法和回声状态网络的异常消费行为检测方法,其特征在于,包括以下步骤:
步骤一:确定相关时间序列采集范围、数据预处理和异常数据初步检测;
步骤二:相关时间序列搜索,待训练时间序列与每条可能与之相关的时间序列执行动态时间规整算法,其相关性判断采用如下公式:
(1)
其中T和R是两个长度分别为M和N的时间序列,有:
wk为相邻矩阵元素的集合称为弯曲路径,其由距离相异矩阵A确定:
式中A中的元素Aij为两个时间序列点ti和rj之间的欧几里得距离;
设定相关性阈值Jthreshold,当JDTW(T,Rq)< Jthreshold,q=1,…,Q,称待训练数据与第q个时间序列为相关性序列,否则为不相关时间序列;其中Q是采集的时间序列个数;
步骤三:将预处理后的输入序列和输出序列送入到回声状态网络,储蓄池回声状态向量x(t)和输出向量y(t)模型如下:
(2)
式中Win和Wx分别为输入权值矩阵和储备池连接权值矩阵,它们是已知的;Wout为储备池输出连接矩阵,是唯一由需要训练求解的参数;时刻储备池内部状态向量x(t)由当前输入uin(t)和上一时刻状态x(t-1)共同激发产生;输出权值使用最小二乘求解输出权值, 表示为:
(3)
式中是X的伪拟;
步骤四:下一时刻的时间序列预测
通过下式获取所述预测数据:
(4)
其中,为第时刻输入值,为第时刻预测数据,为估计的输出权值矩阵;
步骤五:使用回声状态网络估计的预测值,计算其和真实值的差异,若超过设定阈值err,则判断为异常数据,否则判断为正常数据。
2.如权利要求1所述的基于聚类算法和回声状态网络的异常消费行为检测方法,其特征在于:所述步骤二中的动态时间规整算法用于找到待预测时间序列的相关序列,作为回声状态网络的输入序列,其具体步骤如下:
1)确定相关时间序列采集范围:采集范围包括待预测学生整个班的一卡通消费Log数据;
2)数据预处理:从一卡通数据库中采集数据,把采集到的消费Log数据,转换成时间序列形式;对一日三餐消费数据进行求和,得到以天为时间步的时序数据;获得时序数据后,把非平稳数据平稳化及去除数据的趋势性和周期性;
3)初步异常检测:对于需要异常检测的数据,初步使用常规的一卡通异常检测方法判定是否数据异常;若为异常,算法停止,否则继续执行步骤4)-5);
4)相关时间序列搜索:执行动态时间规整算法搜索待训练时间序列与之相关的时间序列,计算其与待训练序列的动态时间规整距离,并设定相关性阈值Jthreshold,当JDTW(T,Rq)<Jthreshold,q=1,…,Q,称待训练数据与第q个时间序列为相关性序列,否则为不相关时间序列;其中Q是采集的时间序列个数;
5)基于相关时间序列的回声状态网络异常检测:设定步骤4)搜索到的相关时间序列为输入序列uin(t),使用回声状态网络对一卡通数据进行一步预测,当预测值和真实值的差异超过设定阈值err,则判断为异常,否则判断为正常。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于河南科技大学,未经河南科技大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201710438150.4/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种O2O优惠券使用大数据预测方法
- 下一篇:一种屏幕信息的推送方法及装置