[发明专利]基于关键词的文章排序方法和装置有效
申请号: | 201611235565.3 | 申请日: | 2016-12-27 |
公开(公告)号: | CN108241721B | 公开(公告)日: | 2020-07-31 |
发明(设计)人: | 栾睿;王雪纯;刘嘉;赵钰;刘乙霖 | 申请(专利权)人: | 北京国双科技有限公司 |
主分类号: | G06F16/9535 | 分类号: | G06F16/9535;G06F16/383;G06F16/332;G06F40/284 |
代理公司: | 北京康信知识产权代理有限责任公司 11240 | 代理人: | 韩建伟;张永明 |
地址: | 100083 北京市海淀区*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 关键词 文章 排序 方法 装置 | ||
1.一种基于关键词的文章排序方法,其特征在于,包括:
获取通过关键词筛选出的至少一篇文章;
将所述至少一篇文章按照所述文章的来源平台划分为多个数据集合;
根据所述来源平台设置每个数据集合的关键词密度标准值;
基于所述每个数据集合的关键词密度标准值,对所述每个数据集合中的文章进行排序;
其中,根据所述来源平台设置每个数据集合的关键词密度标准值,包括:获取所述来源平台的数据特征;根据所述数据特征,设置所述每个数据集合的关键词密度标准值。
2.根据权利要求1所述的方法,其特征在于,基于所述每个数据集合的关键词密度标准值,对所述每个数据集合中的文章进行排序,包括:
计算所述关键词在所述数据集合的每篇文章中的关键词密度值;
按照所述关键词密度值和所述数据集合的关键词密度标准值,对所述文章进行排序。
3.根据权利要求2所述的方法,其特征在于,按照所述关键词密度值和所述数据集合的关键词密度标准值,对所述文章进行排序,包括:
判断所述关键词密度值是否大于所述关键词密度标准值;
在所述关键词密度值大于所述关键词密度标准值的情况下,统计所述关键词在所述文章中预设内容范围内出现的次数;
将所述次数作为排序的依据,对所述数据集合中的文章进行排序。
4.根据权利要求3所述的方法,其特征在于,所述预设内容范围为所述文章最前预设字符的段落,和/或最后预设字符的段落。
5.一种基于关键词的文章排序装置,其特征在于,包括:
第一获取模块,用于获取通过关键词筛选出的至少一篇文章;
划分模块,用于将所述至少一篇文章按照所述文章的来源平台划分为多个数据集合;
第一设置模块,用于根据所述来源平台设置每个数据集合的关键词密度标准值;
第一排序模块,用于基于所述每个数据集合的关键词密度标准值,对所述每个数据集合中的文章进行排序;
其中,所述第一设置模块包括:第二获取模块,用于获取所述来源平台的数据特征;第二设置模块,用于根据所述数据特征,设置所述每个数据集合的关键词密度标准值。
6.根据权利要求5所述的装置,其特征在于,所述第一排序模块包括:
计算模块,用于计算所述关键词在所述数据集合的每篇文章中的关键词密度值;
第二排序模块,用于按照所述关键词密度值和所述数据集合的关键词密度标准值,对所述文章进行排序。
7.根据权利要求6所述的装置,其特征在于,所述第二排序模块包括:
判断模块,用于判断所述关键词密度值是否大于所述关键词密度标准值;
统计模块,用于在所述关键词密度值大于所述关键词密度标准值的情况下,统计所述关键词在所述文章中预设内容范围内出现的次数;
第三排序模块,用于将所述次数作为排序的依据,对所述数据集合中的文章进行排序。
8.根据权利要求7所述的装置,其特征在于,所述预设内容范围为所述文章最前预设字符的段落,和/或最后预设字符的段落。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京国双科技有限公司,未经北京国双科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201611235565.3/1.html,转载请声明来源钻瓜专利网。