[发明专利]一种新闻实时推荐系统及其方法在审
申请号: | 201611138281.2 | 申请日: | 2016-12-12 |
公开(公告)号: | CN106599174A | 公开(公告)日: | 2017-04-26 |
发明(设计)人: | 侯朋;李勇波;孙傲冰;季统凯;张恒 | 申请(专利权)人: | 国云科技股份有限公司 |
主分类号: | G06F17/30 | 分类号: | G06F17/30;G06F17/27 |
代理公司: | 广东莞信律师事务所44332 | 代理人: | 余伦 |
地址: | 523808 广东省东*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明涉及大数据技术领域,尤其是一种新闻实时推荐系统及其方法。本发明包括数据采集层、数据处理层、实时推荐层。本系统运行在Hadoop分布式平台,采集层采集主要中文新闻网站新闻内容,包括新闻链接、新闻标题、新闻发布时间、新闻内容、新闻来源等。将抓取的新闻数据存储到Hbase数据库中,为后面高效的处理与分析数据提供数据源。针对推荐系统的实时性问题,数据处理层是一个能够实时计算的流处理架构。本发明把推荐系统分成离线计算和在线计算两部分,能够充分利用传统的离线推荐算法,并结合在线处理方法,提高推荐系统实时计算的能力;采用Spark做在线处理,实现了推荐系统的实时性。 | ||
搜索关键词: | 一种 新闻 实时 推荐 系统 及其 方法 | ||
【主权项】:
一种新闻实时推荐系统,其特征在于:所述的系统包括数据采集层、数据处理层、实时推荐层;所述的采集层通过网络爬虫在网络中抓取新闻数据,并过滤重复数据,构建新闻数据库;将抓取的新闻数据存储到Hbase数据库中,为后面高效的处理与分析数据提供数据源;所述的数据处理层是一个能够实时计算的流处理架构;该架构把推荐系统分成离线计算和在线计算两部分,利用离线推荐算法结合在线处理,提高推荐系统实时计算的能力;所述的在线处理采用Spark实现;所述的推荐层基于MLlib对推荐引擎模块进行设计,包含模型的训练、模型的测试和新闻的推荐。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于国云科技股份有限公司,未经国云科技股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201611138281.2/,转载请声明来源钻瓜专利网。
- 上一篇:歌词匹配方法及终端
- 下一篇:网页元素的显示处理方法及装置