[发明专利]一种上网偏好用户群体的确定方法和设备有效
申请号: | 201310752439.5 | 申请日: | 2013-12-31 |
公开(公告)号: | CN104750752B | 公开(公告)日: | 2018-06-15 |
发明(设计)人: | 徐萌;何鸿凌;王彦峰;钱岭;孙少凌 | 申请(专利权)人: | 中国移动通信集团公司 |
主分类号: | G06F17/30 | 分类号: | G06F17/30 |
代理公司: | 北京睿博行远知识产权代理有限公司 11297 | 代理人: | 龚家骅 |
地址: | 100032 *** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明实施例公开了一种上网偏好用户群体的确定方法和设备,通过应用本发明实施例所提出的技术方案,在需要确定上网偏好用户群体时,根据上网偏好用户群体所对应的关键词确定相应的目标URL,并结合该目标URL所对应的倒排索引信息,确定对该目标URL的访问次数符合用户筛选条件的各用户标识所对应的用户组成该上网偏好用户群体,从而,充分利用倒排索引信息高性能、高灵活度的特征,实现上网偏好用户群体的快速获取,避免了大量数据记录和匹配所带来的系统资源的消耗,提高了上网偏好用户群体确定过程的处理效率和筛选准确度。 1 | ||
搜索关键词: | 用户群体 偏好 上网 目标URL 方法和设备 倒排索引 关键词确定 处理效率 快速获取 数据记录 系统资源 用户标识 用户筛选 准确度 灵活度 匹配 筛选 消耗 应用 访问 | ||
遍历待分析的用户上网日志记录,分别生成所述用户上网日志记录中所包括的各URL所对应的倒排索引信息,其中,一个URL所对应的倒排索引信息具体包括访问所述URL的用户标识,以及所述用户标识对所述URL的访问特征信息;并且,根据不同的分析周期的需要,对同一个URL分别生成不同时间区间下所对应的倒排索引信息,并分别携带不同的时间戳信息;
当需要确定上网偏好用户群体时,选择所述上网偏好用户群体所对应的一个或多个关键词,并根据选择的关键词确定相应的目标URL;
根据所确定的目标URL所对应的倒排索引信息,确定对所述目标URL的访问特征信息符合用户筛选条件的各用户标识所对应的用户组成所述上网偏好用户群体。
2.如权利要求1所述的方法,其特征在于,所述当需要确定上网偏好用户群体时,选择所述上网偏好用户群体所对应的一个或多个关键词,并根据选择的关键词确定相应的目标URL,具体包括:根据所选择的关键词所对应的倒排索引信息,确定所述关键词的出现次数满足第一URL筛选条件的URL为所述关键词所对应的目标URL,其中,一个关键词所对应的倒排索引信息具体包括含有所述关键词的网页的URL,以及所述关键词在所述网页中的出现次数;或,
根据所选择的关键词在搜索引擎中的网页搜索结果,确定满足第二URL筛选条件的网页的URL为所述关键词所对应的目标URL。
3.如权利要求2所述的方法,其特征在于,所述当需要确定上网偏好用户群体时,选择所述上网偏好用户群体所对应的一个或多个关键词,并根据选择的关键词确定相应的目标URL,还包括:根据所选择的关键词所对应的业务特征信息,对所确定的目标URL进行筛选。
4.如权利要求1所述的方法,其特征在于,所述根据所确定的目标URL所对应的倒排索引信息,确定对所述目标URL的访问特征信息符合用户筛选条件的各用户标识所对应的用户组成所述上网偏好用户群体,具体包括:根据所确定的目标URL所对应的倒排索引信息,及其携带的时间戳信息,确定对所述目标URL的访问次数和访问周期符合用户筛选条件的各用户标识所对应的用户组成所述上网偏好用户群体。
5.一种网络设备,其特征在于,包括:生成模块,用于遍历待分析的用户上网日志记录,分别生成所述用户上网日志记录中所包括的各URL所对应的倒排索引信息,其中,一个URL所对应的倒排索引信息具体包括访问所述URL的用户标识,以及所述用户标识对所述URL的访问特征信息;所述生成模块,还用于:根据不同的分析周期的需要,对同一个URL分别生成不同时间区间下所对应的倒排索引信息,并分别携带不同的时间戳信息;
URL筛选模块,用于在需要确定上网偏好用户群体时,选择所述上网偏好用户群体所对应的一个或多个关键词,并根据选择的关键词确定相应的目标URL;
用户筛选模块,用于根据所述生成模块所生成的与所述URL筛选模块所确定的目标URL相对应的倒排索引信息,确定对所述目标URL的访问特征信息符合用户筛选条件的各用户标识所对应的用户组成所述上网偏好用户群体。
6.如权利要求5所述的网络设备,其特征在于,所述URL筛选模块,具体用于:根据所选择的关键词所对应的倒排索引信息,确定所述关键词的出现次数满足第一URL筛选条件的URL为所述关键词所对应的目标URL,其中,一个关键词所对应的倒排索引信息具体包括含有所述关键词的网页的URL,以及所述关键词在所述网页中的出现次数;或,
根据所选择的关键词在搜索引擎中的网页搜索结果,确定满足第二URL筛选条件的网页的URL为所述关键词所对应的目标URL。
7.如权利要求6所述的网络设备,其特征在于,所述URL筛选模块,还用于:根据所选择的关键词所对应的业务特征信息,对所确定的目标URL进行筛选。
8.如权利要求5所述的网络设备,其特征在于,所述用户筛选模块,具体用于:根据根据所述生成模块所生成的与所述URL筛选模块所确定的目标URL相对应的倒排索引信息,及其携带的时间戳信息,确定对所述目标URL的访问次数和访问周期符合用户筛选条件的各用户标识所对应的用户组成所述上网偏好用户群体。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国移动通信集团公司,未经中国移动通信集团公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201310752439.5/,转载请声明来源钻瓜专利网。