[发明专利]站群检测方法、装置及电子设备有效
申请号: | 202110613985.5 | 申请日: | 2021-06-02 |
公开(公告)号: | CN113360895B | 公开(公告)日: | 2023-07-25 |
发明(设计)人: | 陈由之;刘伟;杨国强;余文利;王鹏;张博 | 申请(专利权)人: | 北京百度网讯科技有限公司 |
主分类号: | G06F21/55 | 分类号: | G06F21/55;G06F21/56;G06F16/955;G06F16/958 |
代理公司: | 北京银龙知识产权代理有限公司 11243 | 代理人: | 黄灿;刘念 |
地址: | 100085 北京市*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 检测 方法 装置 电子设备 | ||
本申请公开了站群识别方法、装置及电子设备,涉及互联网技术领域。具体实现方案为:获取第一站点的站点关联信息,所述站点关联信息包括站点集合中存在关联的不同站点之间的关联类型,所述站点集合包括所述第一站点和所述第一站点对应的M个第二站点;基于所述站点关联信息,生成所述站点集合中站点之间的导流信息,所述导流信息用于表示所述站点集合中存在关联的不同站点在所述关联类型下的导流情况;基于所述导流信息进行目标站群的检测,所述目标站群为存在恶意导流风险的站群。根据本申请的技术,解决了站群检测技术中对存在恶意导流风险的站群的检测效果比较差的问题,提高对存在恶意导流风险的站群的检测效果。
技术领域
本申请涉及互联网技术领域,尤其涉及站群检测技术领域,具体涉及一种站群检测方法、装置及电子设备。
背景技术
互联网中黑灰色产业相关的站点往往相互关联形成站群,通过相互导流来提升站点权重,从而提升在搜索引擎中的收录、索引以及展现数量,最终骗取用户点击或引导用户注册等,这样会侵害用户权益。为了维护互联网的健康发展,需要对存在恶意导流风险的站群进行检测。
目前,通常是通过直接挖掘单个网页的特征来识别存在恶意导流风险的站群中的站点(其可以称之为低质站点),即基于提取网页的内容特征来识别站点是否为低质站点。
发明内容
本公开提供了一种站群检测方法、装置及电子设备。
根据本公开的第一方面,提供了一种站群检测方法,包括:
获取第一站点的站点关联信息,所述站点关联信息包括站点集合中存在关联的不同站点之间的关联类型,所述站点集合包括所述第一站点和所述第一站点对应的M个第二站点,M为正整数;
基于所述站点关联信息,生成所述站点集合中站点之间的导流信息,所述导流信息用于表示所述站点集合中存在关联的不同站点在所述关联类型下的导流情况;
基于所述导流信息进行目标站群的检测,所述目标站群为存在恶意导流风险的站群。
根据本公开的第二方面,提供了一种站群检测装置,包括:
获取模块,用于获取第一站点的站点关联信息,所述站点关联信息包括站点集合中存在关联的不同站点之间的关联类型,所述站点集合包括所述第一站点和所述第一站点对应的M个第二站点,M为正整数;
生成模块,用于基于所述站点关联信息,生成所述站点集合中站点之间的导流信息,所述导流信息用于表示所述站点集合中存在关联的不同站点在所述关联类型下的导流情况;
检测模块,用于基于所述导流信息进行目标站群的检测,所述目标站群为存在恶意导流风险的站群。
根据本公开的第三方面,提供了一种电子设备,包括:
至少一个处理器;以及
与至少一个处理器通信连接的存储器;其中,
存储器存储有可被至少一个处理器执行的指令,该指令被至少一个处理器执行,以使至少一个处理器能够执行第一方面中的任一项方法。
根据本公开的第四方面,提供了一种存储有计算机指令的非瞬时计算机可读存储介质,该计算机指令用于使计算机执行第一方面中的任一项方法。
根据本公开的第五方面,提供了一种计算机程序产品,包括计算机程序,所述计算机程序在被处理器执行时实现第一方面中的任一项方法。
根据本申请的技术解决了站群检测技术中对存在恶意导流风险的站群的检测效果比较差的问题,提高对存在恶意导流风险的站群的检测效果。
应当理解,本部分所描述的内容并非旨在标识本公开的实施例的关键或重要特征,也不用于限制本公开的范围。本公开的其它特征将通过以下的说明书而变得容易理解。
附图说明
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京百度网讯科技有限公司,未经北京百度网讯科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110613985.5/2.html,转载请声明来源钻瓜专利网。