[发明专利]一种基于RFID卡的行为特征提取方法有效
申请号: | 201810533080.5 | 申请日: | 2018-05-29 |
公开(公告)号: | CN108875800B | 公开(公告)日: | 2022-04-12 |
发明(设计)人: | 周庆;王卫芳;葛亮;张宇昂;邹东升;温亚梅;廖凤露 | 申请(专利权)人: | 重庆大学 |
主分类号: | G06K9/62 | 分类号: | G06K9/62 |
代理公司: | 北京康盛知识产权代理有限公司 11331 | 代理人: | 陶俊洁 |
地址: | 400044 *** | 国省代码: | 重庆;50 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 rfid 行为 特征 提取 方法 | ||
1.一种基于RFID卡的行为特征提取方法,其特征在于:
包括以下步骤:
S1:提取RFID卡中指定时间段内的刷卡记录,得到按ID号分组、按时间顺序排序,含有k条记录的刷卡数据Data={record1,record2,...,recordk},k>1且k为正整数;
其中任意一条刷卡记录recorda={ida,Locationa,Timea},其中ida表示第a条记录的ID号,Locationa表示第a条记录的刷卡地点,Timea表示第a条记录的刷卡时间a∈[1,k];
S2:对刷卡数据Data进行分类、分段,提取不同类型的流水数据在不同时间段分布情况,将刷卡数据Data分为M类,M为正整数;
提取识别所有的ID号,总共有N个不同的ID号,即ID={id1,id2,...,idN};
以ID号为研究对象,对每一类别的流水记录按时间划分为T个时间段,得到不同时段的刷卡记录D;
其中m∈[1,M],i∈[1,T],表示在第m种类型的数据在第ti时间段的刷卡流水记录;
S3:对每一类数据进行行为规律特征提取得到规律特征R;
S4:利用k-means聚类算法提取类别特征C;
采用加权组合计算,提取评分特征P;
S5:构建用户的行为特征B={R,C,P};
所述步骤S3中提取规律特征R包括以下步骤:
S3-1:针对每一个ID号,统计其在不同时段的刷卡记录D,提取第m种类型数据的刷卡特征,即表示在第m种类型的数据在第ti时间段的刷卡特征值,i为刷卡特征总数;
S3-2:对每一个ID号刷卡特征值进行四分位数检验,首先按照特征值的大小进行排序,计算上四分位数Q3和下四分位数Q1,当刷卡特征值或时删除异常值特征其中r∈[1,i];
将刷卡特征即f删除异常特征值后得到最终刷卡特征fexpt;
S3-3:将fexpt中的特征值按时间先后顺序排序,提取刷卡地点和刷卡时间,利用频繁项模式挖掘算法,提取行为规律特征R。
2.基于权利要求1所述的一种基于RFID卡的行为特征提取方法,其特征在于:
步骤S4中,评分特征P通过以下步骤计算得出:
S4-1:计算第m中类型数据在规定的T时间内总特征其中
S4-2:计算各个ID第m种类型数据在规定的T时间内总特征Fm与指定类标Y之间的皮尔逊相关系数Pccm,第m种类型的特征赋予权重wm=Pccm;
S4-3:求和运算计算出各个ID的评分特征伯
3.基于权利要求1所述的一种基于RFID卡的行为特征提取方法,其特征在于:
步骤S4中,类别特征C通过以下方法提取:
计算不同ID号第m种类型数据在规定的T时间内总特征Fm的相似性,采用欧氏距离进行度量得到任意两个ID号id1和id2之间的相似性sid1,id2;
其中i∈[1,N],j∈[1,N],且i≠j;
表示第i个ID号在第m种类型数据在规定的T时间内总特征;
利用k-means算法进行聚类,将ID进行分类,提取类别特征C。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于重庆大学,未经重庆大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201810533080.5/1.html,转载请声明来源钻瓜专利网。