[发明专利]一种基于HMM的刷单预测系统及方法有效
申请号: | 202010322827.X | 申请日: | 2020-04-22 |
公开(公告)号: | CN111553726B | 公开(公告)日: | 2023-04-28 |
发明(设计)人: | 高娜;韩德志 | 申请(专利权)人: | 上海海事大学 |
主分类号: | G06Q30/0201 | 分类号: | G06Q30/0201;G06F16/951;G06Q30/0207;G06Q30/0601 |
代理公司: | 上海元好知识产权代理有限公司 31323 | 代理人: | 张静洁;徐雯琼 |
地址: | 201306 上海市*** | 国省代码: | 上海;31 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 hmm 预测 系统 方法 | ||
1.一种基于HMM的刷单预测系统,其特征在于,包括:
数据收集模块,其利用网页爬虫工具获取t时刻若干待检测商品的信息数据,其中0≤t≤T;将t=0时刻的信息数据作为第一数据集,其余时刻的信息数据构成第二数据集;人工为第一数据集的训练集商品设置标签,通过所述标签表示该待检测商品为正常商品或刷单商品;
预处理模块,其根据所述待检测商品的信息数据,提取对应的若干个特征,并根据所述特征生成对应的特征组合值;
HMM模型训练模块,其根据第一数据集的待检测商品的所述标签、特征、特征组合值生成初始HMM模型,采用HMM参数学习的Baum-Welch算法,基于所述第二数据集优化所述初始HMM模型,生成最终的HMM模型;
刷单预测模块,其根据第二数据集的待检测商品的特征组合值和所述最终的HMM模型,采用Viterbi算法实时预测1≤t≤T时刻的刷单结果。
2.如权利要求1所述的基于HMM的刷单预测系统,其特征在于,还包含刷单结果输出模块,其实时将预测的刷单结果反馈到监管部门。
3.如权利要求1所述的基于HMM的刷单预测系统,其特征在于,所述若干个特征包含:待检测商品的未经咨询的订单数,付款订单数,订单总数,确认收货时间,付款时间,商品详情页停留时间,好评数量,销售数量,有追评数量。
4.一种基于HMM的刷单预测方法,采用如权利要求1至3任一所述的基于HMM的刷单预测系统实现的,其特征在于,包含步骤:
S1、通过数据收集模块获取t时刻第一至第μ待检测商品的信息数据,其中0≤t≤T,μ为待检测商品总数;将t=0时刻的信息数据作为第一数据集,其余时刻的信息数据构成第二数据集;人工为第一数据集的待检测商品设置标签,通过所述标签表示该待检测商品为正常商品或刷单商品;
S2、通过预处理模块根据t时刻第一至第μ待检测商品的信息数据,提取对应的若干个特征,并根据所述特征生成对应的特征组合值;0≤t≤T;
S3、将第一数据集的待检测商品的标签、特征、特征组合值输入HMM模型训练模块,采用监督学习方法得到初始HMM模型;
S4、基于第二数据集,对所述初始HMM模型采用Baum-Welch算法进行优化,生成最终的HMM模型并保存至刷单预测模块;
S5、将第二数据集内待检测商品的特征及特征组合值输入到刷单预测模块,采用Viterbi算法实时预测1≤t≤T时刻第二数据集的刷单结果。
5.如权利要求4所述的基于HMM的刷单预测方法,其特征在于,步骤S2具体包含:
S21、根据第i待检测商品在t时刻的信息数据,提取对应的特征其中,i∈[1,μ],k∈[1,9];分别为第i待检测商品在t时刻的未经咨询的订单数,付款订单数,订单总数,确认收货时间,付款时间,商品详情页停留时间,好评数量,销售数量,有追评数量;
S22、根据生成第一至第六特征率分别为第i待检测商品在t时刻的静默转化率,订单付款率,成交时间差,商品详情页停留时间,好评率,追评率;其中
S23、采用正规化方法,将进行标准化;
S24、根据标准化后的计算得到对应的特征组合值为标准化后的的权重。
6.如权利要求4所述的基于HMM的刷单预测方法,其特征在于,步骤S24中,通过熵值法计算得到具体包含:
S241、计算第j特征率的熵值其中k=1/ln(μ);
S242、计算第j特征率的信息熵冗余度
S243、第j特征率的权重
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于上海海事大学,未经上海海事大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010322827.X/1.html,转载请声明来源钻瓜专利网。