[发明专利]关键词过滤方法和装置有效
申请号: | 201410134760.1 | 申请日: | 2014-04-03 |
公开(公告)号: | CN103902714B | 公开(公告)日: | 2017-08-01 |
发明(设计)人: | 洪超 | 申请(专利权)人: | 北京国双科技有限公司 |
主分类号: | G06F17/30 | 分类号: | G06F17/30 |
代理公司: | 北京康信知识产权代理有限责任公司11240 | 代理人: | 李志刚,吴贵明 |
地址: | 100086 北京市海淀区*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 关键词 过滤 方法 装置 | ||
技术领域
本发明涉及关键词过滤领域,具体而言,涉及一种关键词过滤方法和装置。
背景技术
在通过数据库系统进行关键词选取的过程中,通常需要对关键词进行过滤,将关键词中的一些非法关键词、敏感关键词或是恶意关键词过滤。例如,当需要选取搜索引擎中搜索次数前10个关键词时,通常先查询出Top20或是Top100的关键词,再从查询出的关键词中过滤掉非法关键词,该非法关键词可以根据需要进行自定义,如满足一定规则的恶意关键词等。最后从剩下的关键词里选取出排名前10的关键词。
在上述选取关键词的过程中,通常出现过滤后的关键词的数量小于需要选取的关键词的数量,导致无法准确的返回相应数量的关键词。例如上述中,Top20或是Top100中的关键词经过过滤之后,剩下关键词的数量小于10个。此时,需要返回所有的关键词,重新执行上述操作,这样造成数据库系统很大的开销。
针对现有技术中由于过滤后的关键词的数量小于需要选取的关键词的数量导致无法准确的返回相应数量的关键词的问题,目前尚未提出有效的解决方案。
发明内容
本发明的主要目的在于提供一种关键词过滤方法和装置,以解决由于过滤后的关键词的数量小于需要选取的关键词的数量导致无法准确的返回相应数量的关键词的问题。
为了实现上述目的,根据本发明的一个方面,提供了一种关键词过滤方法。根据本发明的关键词过滤方法包括:由互联网查询结果中获取多个关键词;按照预设匹配规则对多个关键词进行过滤,得到第一数量的关键词;从第一数量的关键词中选取第二数量的关键词;以及输出第二数量的关键词。
进一步地,从第一数量的关键词中选取第二数量的关键词包括:获取第一数量的关键词中每一个关键词被搜索的次数;以及基于被搜索的次数从第一数量的关键词选取第二数量的关键词。
进一步地,在按照预设匹配规则对多个关键词进行过滤之前,关键词过滤方法还包括:创建关键词过滤表,关键词过滤表中包括预设匹配规则,其中,按照预设匹配规则对多个关键词进行过滤包括:将多个关键词依次与关键词过滤表进行匹配;以及根据与关键词过滤表不匹配的关键词生成合法关键词列,将合法关键词列中的关键词作为第一数量的关键词,其中,与关键词过滤表匹配的关键词置为预设的默认值。
进一步地,当在多个关键词中插入新增关键词时,按照预设匹配规则对多个关键词进行过滤还包括:通过trigger触发器将新增关键词与关键词过滤表进行匹配,得到匹配结果;以及根据匹配结果重新生成合法关键词列。
进一步地,当多个关键词中关键词发生更改时,按照预设匹配规则对多个关键词进行过滤还包括:通过trigger触发器将更改的关键词与关键词过滤表进行匹配,得到匹配结果;以及根据匹配结果重新生成合法关键词列。
为了实现上述目的,根据本发明的另一方面,提供了一种关键词过滤装置。根据本发明的关键词过滤装置包括:获取单元,用于由互联网查询结果中获取多个关键词;过滤单元,用于按照预设匹配规则对多个关键词进行过滤,得到第一数量的关键词;选取单元,用于从第一数量的关键词中选取第二数量的关键词;以及输出单元,用于输出第二数量的关键词。
进一步地,选取单元包括:获取模块,用于获取第一数量的关键词中每一个关键词被搜索的次数;以及选取模块,用于基于被搜索的次数从第一数量的关键词选取第二数量的关键词。
进一步地,关键词过滤装置还包括:创建单元,用于在按照预设匹配规则对多个关键词进行过滤之前,创建关键词过滤表,关键词过滤表中包括预设匹配规则,其中,过滤单元包括:第一匹配模块,用于将多个关键词依次与关键词过滤表进行匹配;以及第一生成模块,用于根据与关键词过滤表不匹配的关键词生成合法关键词列,将合法关键词列中的关键词作为第一数量的关键词,其中,与关键词过滤表匹配的关键词置为预设的默认值。
进一步地,过滤单元还包括:第二匹配模块,用于当在多个关键词中插入新增关键词时,通过trigger触发器将新增关键词与关键词过滤表进行匹配,得到匹配结果;以及第二生成模块,用于根据匹配结果重新生成合法关键词列。
进一步地,过滤单元还包括:第三匹配模块,用于当多个关键词中关键词发生更改时,通过trigger触发器将更改的关键词与关键词过滤表进行匹配,得到匹配结果;以及第三生成模块,用于根据匹配结果重新生成合法关键词列。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京国双科技有限公司,未经北京国双科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201410134760.1/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种红茶的高温有氧发酵室
- 下一篇:肠衣对准装置