[发明专利]一种基于在线用户评分的敏锐用户识别的方法有效
申请号: | 201811414485.3 | 申请日: | 2018-11-26 |
公开(公告)号: | CN109559169B | 公开(公告)日: | 2022-12-13 |
发明(设计)人: | 刘建国;刘晓露;江明珠;郭强 | 申请(专利权)人: | 上海财经大学 |
主分类号: | G06Q30/02 | 分类号: | G06Q30/02;G06Q50/00 |
代理公司: | 北京科亿知识产权代理事务所(普通合伙) 11350 | 代理人: | 汤东凤 |
地址: | 200433 *** | 国省代码: | 上海;31 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 在线 用户 评分 敏锐 识别 方法 | ||
1.一种基于在线用户评分的敏锐用户识别的方法,其特征在于,包括如下步骤:
S1、获取在线社交系统中评分系统的现有数据,得到用户对产品评分的信息的字段;
S2、根据步骤S1中获得的字段,将评分系统中用户对产品评分的信息整理成“用户产品评分”的形式;
S3、计算在线社交系统中各用户的用户敏锐度:
用户和产品的集合分别用U和O来表示,用户的总量、产品的总量和原始评分记录的总量分别用|U|、|O|和|E|表示;原始评分记录的字段包括用户、产品、评分、时间标;用户i对产品α的评分用riα表示,评分riα的时间标用tiα表示,评分系统中设置的可以打出的最高分用rh表示;Uα表示所有对产品α有过评分的用户集合,Oi表示用户i所有给过评分的产品集合;另外,用户i和产品α的度分别用ki和ρα表示;高质量产品集合和其他产品集合分别用集合O1和O2表示,集合O1和O2满足O1∪O2=O并且O1∩O2={φ};同时,高质量产品和其他产品的个数分别用n1和n2表示,n1+n2=|O|;
对于集合O1中的每个高质量产品α,追踪在高质量产品生命周期的早期就对高质量产品打出过最高分rh的用户,分别计算每个用户i对集合O1的高质量产品在产品生命周期的早期就打出过最高分rh的次数Di,0≤Di≤n1;具体按照下式计算:
其中Diα是一个二进制变量,表示用户i是否在高质量产品α,α∈O1出现前θ,0<θ<1时期就打出过最高分,是的话Diα值就为1,否则就为0;tα1和分别表示对高质量产品α,α∈O1评分的最早时间和最晚时间;参数θ是对高质量产品生命周期初期的一个定量的比例,为可调参数,高质量产品生命周期的前θ比例的时期确定为高质量产品生命周期初期;
最后,用Di占高质量产品总数的比例来度量用户i的用户敏锐度pi:
S4、根据步骤S3中计算得到的每个用户的用户敏锐度,识别出在线社交系统中的敏锐用户。
2.根据权利要求1所述的基于在线用户评分的敏锐用户识别的方法,其特征在于,步骤S4的具体过程为:
S4.1、按照设定的次数Q重复进行如下计算:
采用Bootstrap抽样的方法,有放回地在原始评分记录中随机抽取|E|个样本形成样本集合,并且在样本集合中按照步骤S3的方法计算样本集合中每个用户的敏锐度;
S4.2、按照下式计算每个用户的平均用户敏锐度和用户的平均敏锐度中的最大值pBmax:
其中表示第x次Bootstrap抽样中对用户i计算得到的用户敏锐度;得到pBmax后,将步骤S3中的每个用户的用户敏锐度和pBmax进行比较,原始的评分记录中用户敏锐度高于pBmax的用户被认为是敏锐用户。
3.根据权利要求1所述的基于在线用户评分的敏锐用户识别的方法,其特征在于,还包括如下步骤:
S5、采用机器学习的方式对新进入在线社交系统的数据涉及的用户进行预测,预测其是否为敏锐用户。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于上海财经大学,未经上海财经大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201811414485.3/1.html,转载请声明来源钻瓜专利网。