[发明专利]移动互联网内容的用户偏好推送方法与装置有效

专利信息
申请号: 201210248221.1 申请日: 2012-07-17
公开(公告)号: CN103544188A 公开(公告)日: 2014-01-29
发明(设计)人: 张湛梅;叶始新;罗芸;陈东明;屈强 申请(专利权)人: 中国移动通信集团广东有限公司
主分类号: G06F17/30 分类号: G06F17/30
代理公司: 北京银龙知识产权代理有限公司 11243 代理人: 许静;刘伟
地址: 510623 广东省广州市珠*** 国省代码: 广东;44
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 移动 互联网 内容 用户 偏好 推送 方法 装置
【说明书】:

技术领域

发明涉及移动互联网领域,更具体的,涉及一种移动互联网内容的用户偏好推送方法与装置。 

背景技术

传统的电信系统以语音为主,基本不考虑阅读内容形式的处理,因此无法支撑互联网内容偏好的分析;而现有的内容分析技术以文本处理技术为主,需要深入到信息主体进行关键字匹配等文本识别处理,才能分析出用户的具体内容偏好。这种方案对于运营商上亿级用户量,无论是开发还是维护,都需要投入大量的资源。 

根据当前互联网内容分析相关的学术论文和项目建设调研,总结现有的系统或方案,主要存在以下几个缺点: 

首先是技术较为复杂,开发难度高。传统的方案是需要利用爬虫技术抓取一定量的文本内容,然后利用关键字匹配技术对文本进行分类。对于爬虫技术和文本分类技术,虽然在学术界已经是一个热门课题,但其技术大部分基于理论,对于移动互联网业务应用,其实际的开发难度较高、开发周期较长。 

其次是资源要求较高,推广成本高。根据某省份的项目建设经验,为了实现全省的互联网内容分析,需要配置4台爬虫服务集群服务器,4台分析服务集群服务器,6台搜索服务器集群,还有至少28T的存储空间,而且这些服务器还和其现有的运营平台有直接的依赖,其推广成本很高,加上技术复杂,其推广可行性变得更低。 

然后是分析层面单一,偏好识别的可信度和健壮性较低。由于互联网内容提供商经常会通过采用内容捆绑、弹出页面、自动跳转等各种手段来达到增加访问流量的目的,因此各种日志信息中包含了大量的噪声,用户阅读的内容中也会包含很多非用户真实偏好的具体内容。现有的分析主要建立在用户手机上 网的阅读的网页内容上,其分析得到的用户内容偏好是包含噪声的内容偏好,其可信任程度较低。另外,网页分类精确度容易受到网页形式变化(如分类名称关键字的修改)的影响,而且其内容偏好标签的含义随着内容形式也会对应变化,现有技术依赖关键字识别等技术来对内容进行分类,分析出来的偏好相对狭义,其健壮性较低。实际上,更健壮的内容偏好应该是建立在多个不同性质,甚至是不同粒度的业务内容的分析之上的。 

最后是应用范围较窄,业务拓展的实时效率较低。即使平台分析出的用户偏好是非常精确的,但对于不同性质或不同粒度的业务(如拓展到其他如手机游戏、全曲音乐等的内容业务时),甚至是同一业务增加新的内容分类时(如手机上网增加新网站或新内容分类时),现有技术需要积累一定量的用户之后,才能利用这些内容偏好标签分析存量用户的行为特征,进而开发专门的潜在用户挖掘模型,一方面应用范围较窄,而另一方面,对于内容发展如此迅速的互联网时代,现有技术的实时效率较低。在应用层面,更好的内容偏好分析系统设计,应该是能充分考虑并解决新增业务或内容时潜在用户的拓展问题。 

根据上述分析,可以发现,现有技术中存在互联网内容用户的偏好信息获取及推送存在困难的问题。 

发明内容

本发明提供一种移动互联网内容的用户偏好推送方法与装置,用于解决现有技术中存在互联网内容用户的偏好信息获取及推送存在困难的问题。 

为实现上述目的,根据本发明的第一个方面,提供一种移动互联网内容的用户偏好推送方法,并采用以下技术方案: 

移动互联网内容的用户偏好推送方法包括:基于用户的访问行为获取所述用户访问的第一信息;对所述第一信息中所述用户所涉及的网络内容进行分类处理,得到第二信息;根据所述第二信息对所述用户的偏好进行评分,得出所述用户的偏好信息;根据所述偏好信息向相应的用户推送与所述偏好信息相对应的网络内容。

进一步地,所述基于用户的访问行为获取所述用户访问的第一信息包括:根据所述用户的访问行为从移动互联网的服务器中得到所述用户访问的基础 数据;根据所述基础数据获取所述用户访问的业务内容,并根据所述基础数据的增加,对所述业务内容进行扩展,生成所述第一信息。 

进一步地,所述对所述第一信息中用户所所涉及的网络内容进行分类处理包括:基于用户的访问行为获取所述用户访问的第一信息;判断所述第一信息中每一业务内容是否具有预设的第一分类规则,并得一判断结果;对所述判断结果为具有所述第一分类规则的业务内容,按照所述第一分类规则对所述业务内容进行分类;对所述判断结果为不具有所述第一分类规则的业务内容,按照第二分类规则对所述业务内容进行分类;根据所述第二信息对所述用户的偏好进行评分,得出所述用户的偏好信息。 

进一步地,所述第二分类规则为临时构建的分类规则,且所述构建的方法参照所述第一分类规则的构建方法。 

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国移动通信集团广东有限公司,未经中国移动通信集团广东有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/201210248221.1/2.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top