[发明专利]一种黑灰产推广的关键词查找方法在审
申请号: | 201910076690.1 | 申请日: | 2019-01-26 |
公开(公告)号: | CN109947913A | 公开(公告)日: | 2019-06-28 |
发明(设计)人: | 董超;蒋希敏;赵玉元 | 申请(专利权)人: | 浙江乾冠信息安全研究院有限公司 |
主分类号: | G06F16/332 | 分类号: | G06F16/332;G06F16/951;G06F16/953;G06F16/9535 |
代理公司: | 暂无信息 | 代理人: | 暂无信息 |
地址: | 310015 浙江省*** | 国省代码: | 浙江;33 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明提供一种黑灰产推广的关键词查找方法,涉及数据处理技术领域。在建立的key‑value关键词权重有序表中提取最大权值且未使用的关键词,通过搜索引擎进行查找,直接提取查找出来的每条结果中有黑灰产推广的相关和扩展性质信息的关键句文本、相关搜索关键词,分配权重赋值后权值相加,得到挖掘的关键词合并到key‑value表,得到新的表。本发明解决了现有技术中找出黑灰产关键词需要人工维护成本较高,且效率低的技术问题。本发明有益效果为:能实时获取关于网民搜索黑灰产动态以及黑灰产推广最新趋势。对于检测黑灰产网页也有极大帮助。 | ||
搜索关键词: | 黑灰 关键词查找 数据处理技术 搜索关键词 查找 分配权重 扩展性质 实时获取 搜索引擎 直接提取 未使用 权重 网民 相加 搜索 网页 文本 合并 挖掘 检测 帮助 维护 | ||
【主权项】:
1.一种黑灰产推广的关键词查找方法,其特征在于,包括以下步骤:步骤一:在建立的具有使用过的关键词(used words)数组和所有的关键词(all words)字典的key‑value关键词权重有序表中,通过相似度比较技术,提取所有的关键词(all words)字典中最大权值且未使用的关键词;步骤二:通过搜索引擎直接搜索该提取的关键词,将获取的相关网页内容解码为Unicode;步骤三:直接提取搜索引擎查找出来的每条结果中有黑灰产推广的相关和扩展性质信息的关键句文本、相关搜索关键词;步骤四:将提取的关键句文本、相关搜索关键词按特征分类,分配权重,将关键句分词,分词继承分配权重,相同的分词权重相加得到一组挖掘的关键词;步骤五:将步骤一中所有提取的关键词和挖掘的关键词分别合并到原有key‑value关键词权重有序表中的使用过的关键词(used words)数组和所有的关键词(all words)字典,获得新的key‑value关键词权重有序表;步骤六:重复循环步骤一至五,直到步骤一中所有的关键词(all words)字典不能获取新的关键词,所有的关键词(all words)字典即挖掘关键词key‑value有序表。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于浙江乾冠信息安全研究院有限公司,未经浙江乾冠信息安全研究院有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201910076690.1/,转载请声明来源钻瓜专利网。