[发明专利]一种关键词热度自动控制方法有效
申请号: | 201310524337.8 | 申请日: | 2013-10-30 |
公开(公告)号: | CN103544294B | 公开(公告)日: | 2017-02-01 |
发明(设计)人: | 黎小为;廖耀华 | 申请(专利权)人: | 北京京东尚科信息技术有限公司;北京京东世纪贸易有限公司 |
主分类号: | G06F17/30 | 分类号: | G06F17/30 |
代理公司: | 北京邦信阳专利商标代理有限公司11012 | 代理人: | 王昭林,胡冰 |
地址: | 100080 北京*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 关键词 热度 自动控制 方法 | ||
1.一种关键词热度自动控制方法,其特征在于,包括:
1)为关键词设置关键词热度;
2)将满足调度条件的关键词推送到抓取队列;
3)从抓取队列中提取一个关键词用搜索引擎进行搜索;
4)根据搜索引擎的搜索结果调整关键词热度。
2.根据权利要求1所述的关键词热度自动控制方法,其特征在于,
在步骤2)中,所述调度条件为,该关键词的调度时间小于或等于系统当前时间。
3.根据权利要求2所述的关键词热度自动控制方法,其特征在于,
步骤2)还包括:通过如下方式更新该关键词的调度时间,调度时间=系统当前时间+调度时间间隔。
4.根据权利要求3所述的关键词热度自动控制方法,其特征在于,所述调度时间间隔根据该关键词的热度而设定。
5.根据权利要求1所述的关键词热度自动控制方法,其特征在于,在步骤3)中,利用网络爬虫从抓取队列中提取一个关键词进行搜索。
6.根据权利要求5所述的关键词热度自动控制方法,其特征在于,在步骤3)中,所述网络爬虫使用关键词拼接微博搜索链接利用微博搜索引擎进行搜索。
7.根据权利要求1所述的关键词热度自动控制方法,其特征在于,
在步骤3)中,用IE搜索引擎进行搜索;
在步骤4)中,解析所述IE搜索引擎的搜索结果页面,包括:使用jsoup工具将搜索结果页面转化成DOM树结构;使用jsoup的DOM选择器;选择指定标签下的内容,使用正则表达式抽取出数字作为关键词相关网页数量,以及扫描该关键词是否被屏蔽;以相关网页数量和关键词是否被屏蔽的信息作为搜索结果。
8.根据权利要求7所述的关键词热度自动控制方法,其特征在于,
在步骤4)中,根据两次搜索结果的相关网页数量的增量来调整关键词热度。
9.根据权利要求7所述的关键词热度自动控制方法,其特征在于,
在步骤4)中,如果关键词被屏蔽,则删除该关键词。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京京东尚科信息技术有限公司;北京京东世纪贸易有限公司,未经北京京东尚科信息技术有限公司;北京京东世纪贸易有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201310524337.8/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种薏仁猪皮糕的制作方法
- 下一篇:一种酱制草地蘑菇的制备方法