[发明专利]文章的自动选取方法及装置有效
申请号: | 201310031843.3 | 申请日: | 2013-01-28 |
公开(公告)号: | CN103970754B | 公开(公告)日: | 2018-05-18 |
发明(设计)人: | 蔡兵 | 申请(专利权)人: | 腾讯科技(深圳)有限公司 |
主分类号: | G06F17/30 | 分类号: | G06F17/30 |
代理公司: | 北京康信知识产权代理有限责任公司 11240 | 代理人: | 赵囡囡 |
地址: | 518044 广东省深圳*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 文章 自动 选取 方法 装置 | ||
1.一种文章的自动选取方法,其特征在于,包括如下步骤:
建立索引数据库步骤,该步骤包括扫描用户点击日志,根据所述用户点击日志建立被用户点击的所有文章的相关信息的索引数据库;
生成相关文章列表步骤,该步骤包括分析给定文章与所述索引数据库中的其他文章之间的相似度,根据所述相似度选取所述索引数据库中的与所述给定文章相关的文章生成相关文章列表;
生成热门文章列表步骤,该步骤包括根据所述用户点击日志分析所述索引数据库中每篇文章的热度值,从索引数据库中选取所述热度值在预定范围内的文章生成热门文章列表;
生成同站点文章列表步骤,该步骤包括由所述索引数据库中提取出与所述给定文章站点相同的文章生成同站点文章列表;
列表组合传输步骤,该步骤包括将所述相关文章列表、所述同站点文章列表以及所述热门文章列表中至少两个列表的组合传输给同一个客户端进行显示。
2.根据权利要求1所述的方法,其特征在于,所述生成相关文章列表步骤包括:
分析所述给定文章以及所述索引数据库中的其他文章以确定每篇文章的关键词;
根据所确定的关键词计算所述给定文章与所述索引数据库中的其他文章之间的相似度;
根据所述相似度选取所述给定文章的相关文章生成相关文章列表。
3.根据权利要求1所述的方法,其特征在于,所述生成相关文章列表步骤包括:
计算所述给定文章与所述索引数据库中的其他文章之间的相似度;
分析所述给定文章以及所述索引数据库中的其他文章以确定每篇文章的关键词;
由所述索引数据库中的其他文章中提取出与所述给定文章具有相同关键词的文章;
根据所述相似度对所提取出的文章进行排序并选取所述给定文章的相关文章生成相关文章列表。
4.根据权利要求2或3所述的方法,其特征在于,所述生成相关文章列表步骤包括:
选取相似度在预定范围内的文章作为所述给定文章的相关文章生成相关文章列表。
5.根据权利要求1所述的方法,其特征在于,所述文章的热度值为,在当前时间与文章发表的时间段内所述文章被点击的次数与该时间段的比值。
6.根据权利要求1所述的方法,其特征在于,所述生成同站点文章列表步骤包括:
由所述索引数据库中提取出与所述给定文章站点相同的文章;
由所提取出的站点相同的文章中随机选出多篇文章生成所述同站点文章列表。
7.根据权利要求1所述的方法,其特征在于,所述方法进一步包括生成同主题文章列表步骤,该步骤中由所述索引数据库中提取出与所述给定文章主题相同的文章并生成同主题文章列表;其中,所述列表组合传输步骤包括将所述相关文章列表、所述同站点文章列表、所述同主题文章列表以及所述热门文章列表中至少两个列表的组合传输给同一个客户端进行显示。
8.根据权利要求7所述的方法,其特征在于,所述生成同主题文章列表步骤包括:
根据文章的发布时间以及文章的热度值对所述同主题文章设置权重;
根据每篇文章对应的权重对所述同主题文章进行排序;
随机选出排序号在预定范围内的多篇文章生成所述同主题文章列表。
9.根据权利要求1所述的方法,其特征在于,所述方法进一步包括:每隔预定时间扫描一次所述用户点击日志,并根据所述用户点击日志更新所述索引数据库。
10.根据权利要求1所述的方法,其特征在于,所述方法进一步包括:实时分析用户点击日志中的用户点击量以重新调整所述相关文章列表、所述同站点文章列表以及所述热门文章列表的组合方式。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于腾讯科技(深圳)有限公司,未经腾讯科技(深圳)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201310031843.3/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种超净工作台
- 下一篇:一种医学检验用的移液器