[发明专利]一种新闻推荐方法及装置有效
申请号: | 201510793972.5 | 申请日: | 2015-11-17 |
公开(公告)号: | CN105224699B | 公开(公告)日: | 2020-01-03 |
发明(设计)人: | 邓宏栋 | 申请(专利权)人: | TCL集团股份有限公司 |
主分类号: | G06F16/9535 | 分类号: | G06F16/9535 |
代理公司: | 44237 深圳中一专利商标事务所 | 代理人: | 张全文 |
地址: | 516006 广东省*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 新闻 推荐 方法 装置 | ||
1.一种新闻推荐方法,其特征在于,所述方法包括:
将新闻按照内容进行分类;
获取选定时刻用户对各类新闻的点击量和所有用户对各类新闻的点击总量,并根据各类新闻的所述点击量和所述点击总量,计算得到所述用户在所述选定时刻的新闻兴趣模型;其中,所述新闻兴趣模型是指用户和其感兴趣的新闻的对应关系;
根据新闻热度和新闻内容,确定各类新闻中每条新闻的权重值,包括:对每条新闻的标题和关键词进行分词,并根据分词对预置时间段内的新闻进行搜索;通过杰卡德公式对搜索结果进行相似度计算,并按照计算得到的相似度从高到低排列;保留相似度大于阈值的结果集,并按照预置数值增加所述结果集中的分词对应的新闻的权重值;
按照所述选定时刻的新闻兴趣模型,加权平均得到包含多个所述选定时刻的预置时间段内的最终新闻兴趣模型;其中,新闻具有时刻权重值,时间越靠近当前时刻,新闻的时刻权重值越大;
按照所述最终新闻兴趣模型聚类各用户,并根据所述最终新闻兴趣模型及新闻热度确定向聚类后的各类用户推荐的新闻候选集;
将所述新闻候选集中的新闻推荐给所述用户。
2.根据权利要求1所述的方法,其特征在于,所述将新闻按照内容进行分类包括:
通过朴素贝叶斯分类算法,将新闻按照内容进行分类。
3.根据权利要求1或2所述的方法,其特征在于,所述根据各类新闻的所述点击量和所述点击总量,计算得到所述用户在所述选定时刻的新闻兴趣模型包括:
根据各类新闻的所述点击量和所述点击总量,通过贝叶斯全概率算法计算得到所述用户在所述选定时刻的新闻兴趣模型。
4.根据权利要求3所述的方法,其特征在于,所述将所述新闻候选集中的新闻推荐给所述用户包括:
将所述新闻候选集中的新闻按照发布时间以及所述权重值进行降序排列,并按照排列的先后顺序向所述用户推荐新闻。
5.根据权利要求1所述的方法,其特征在于,所述方法还包括:
定期获取所述用户点击新闻的历史记录,根据所述历史记录更新所述用户的新闻兴趣模型。
6.一种新闻推荐装置,其特征在于,所述装置包括:
分类模块,用于将新闻按照内容进行分类;
获取模块,用于获取选定时刻用户对各类新闻的点击量和所有用户对各类新闻的点击总量;
计算模块,用于根据各类新闻的所述点击量和所述点击总量,计算得到所述用户在所述选定时刻的新闻兴趣模型;其中,所述新闻兴趣模型是指用户和其感兴趣的新闻的对应关系;
所述计算模块,还用于按照所述选定时刻的新闻兴趣模型,加权平均得到包含多个所述选定时刻的预置时间段内的最终新闻兴趣模型;其中,新闻具有时刻权重值,时间越靠近当前时刻,新闻的时刻权重值越大;
聚类模块,用于按照所述最终新闻兴趣模型聚类各用户;
确定模块,用于根据新闻热度和新闻内容,确定各类新闻中每条新闻的权重值;并根据所述最终新闻兴趣模型及新闻热度确定向聚类后的各类用户推荐的新闻候选集;
推荐模块,用于将所述新闻候选集中的新闻推荐给所述用户;
其中,所述确定模块具体包括:
分词模块,用于对每条新闻的标题和关键词进行分词;
搜索模块,用于根据分词对所述预置时间段内的新闻进行搜索;
计算子模块,用于通过杰卡德公式对搜索结果进行相似度计算;
排序子模块,用于按照计算得到的相似度从高到低排列;
更新权重模块,用于保留相似度大于阈值的结果集,并按照预置数值增加所述结果集中的分词对应的新闻的权重值。
7.根据权利要求6所述的装置,其特征在于,所述分类模块用于通过朴素贝叶斯分类算法,将新闻按照内容进行分类;
所述计算模块用于根据各类新闻的所述点击量和所述点击总量,通过贝叶斯全概率算法计算得到所述用户在所述选定时刻的新闻兴趣模型。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于TCL集团股份有限公司,未经TCL集团股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201510793972.5/1.html,转载请声明来源钻瓜专利网。