[发明专利]宽带用户属性识别方法和装置有效
申请号: | 201210082337.2 | 申请日: | 2012-03-26 |
公开(公告)号: | CN102646132A | 公开(公告)日: | 2012-08-22 |
发明(设计)人: | 李卫;张云勇;郭志斌;程莹;刘露 | 申请(专利权)人: | 中国联合网络通信集团有限公司 |
主分类号: | G06F17/30 | 分类号: | G06F17/30 |
代理公司: | 北京同立钧成知识产权代理有限公司 11205 | 代理人: | 华泽珍 |
地址: | 100033 *** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 宽带用户 属性 识别 方法 装置 | ||
1.一种宽带用户属性识别方法,其特征在于,包括:
获取宽带用户的网页浏览日志,其中,所述网页浏览日志中的各条网页浏览信息至少包括网页地址和网页浏览时间;
按照所述网页地址,将所述网页浏览信息进行分类;
将分类后的网页浏览信息按照时间窗进行划分和统计,各所述时间窗为预设的不同网页浏览时间段;
根据统计结果产生所述宽带用户对应的各时间窗的兴趣属性。
2.根据权利要求1所述的宽带用户属性识别方法,其特征在于,按照所述网页地址,将所述网页浏览信息进行分类包括:
按照所述网页地址,根据预先设定的文本分类模型,对所述网页浏览信息进行分类,产生用户u的属性序列L(u):
L(u)={(p1.cluster,p1.time),...,(pi.cluster,pi.time),...,(pM.cluster,pM.time)};
其中,pi.cluster表示用户u对应的网页浏览信息中用户u访问的第i个网页pi所属的主题类别,pi.time表示用户u访问网页pi的时间,M表示用户u网页浏览日志中用户u访问的网页总数,1≤i≤M,(pi.cluster,pi.time)记为每个主题类别序列;
所述将分类后的网页浏览信息按照时间窗进行划分和统计包括:
针对每个主题类别序列,基于如下公式按照时间窗进行划分和统计,获取时间窗序列L(u,d,j):
L(u,d,j)={(clusterj1,wj1),...,(clusterjr,wjr),...,(clusterjNr,wjNr)};
其中,clusterjr表示用户u对应的网页浏览信息中用户u在第d天的第j个时间窗内访问的第r个主题类别,wjr表示用户u在第d天的第j个时间窗内访问的第r个主题类别的权重,Nr表示用户u在第d天的第j个时间窗内访问的主题类别的总数,1≤j≤H,H表示每天的最后一个时间窗;
所述主题类别的权重wjr按照如下公式计算,njr表示所述用户u对应的网页浏览信息中用户u在第d天的第j个时间窗内访问的第r个主题类别的数目:
3.根据权利要求1或2所述的宽带用户属性识别方法,其特征在于,在所述根据统计结果产生所述宽带用户对应的至少两个兴趣属性之后,还包括:
向推送平台发送所述宽带用户对应的各时间窗的兴趣属性,以使所述推送平台在每个兴趣属性所对应的时间窗内,向所述宽带用户下发所述兴趣属性对应的推送信息。
4.根据权利要求3所述的宽带用户属性识别方法,其特征在于,在向所述宽带用户下发所述兴趣属性对应的推送信息之前,还包括:
每隔预设周期,获取宽带用户的当前兴趣属性;
将所述当前兴趣属性与根据统计结果产生的宽带用户对应的兴趣属性进行比较,当比较结果一致时,执行向所述宽带用户下发所述兴趣属性对应的推送信息的操作,否则,停止操作。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国联合网络通信集团有限公司,未经中国联合网络通信集团有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201210082337.2/1.html,转载请声明来源钻瓜专利网。