[发明专利]侵权网站搜索识别方法及装置在审
申请号: | 201810425143.5 | 申请日: | 2018-05-07 |
公开(公告)号: | CN108664584A | 公开(公告)日: | 2018-10-16 |
发明(设计)人: | 秦德玉 | 申请(专利权)人: | 秦德玉 |
主分类号: | G06F17/30 | 分类号: | G06F17/30 |
代理公司: | 暂无信息 | 代理人: | 暂无信息 |
地址: | 102211 北京市昌*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 关键信息 网站 目标网站 网站搜索 搜索 查找 爬虫 匹配信息 人力物力 省时高效 搜索结果 搜索系统 用户展示 专用网络 网络 网页 节约 发现 | ||
1.一种侵权网站搜索识别方法,其特征在于,所述方法包括:
确定目标网站对应的关键信息,所述关键信息为描述目标网站特定业务的信息;
根据所述关键信息,基于专用网络爬虫搜索系统,在网络中搜索第一网页得到搜索结果,所述第一网页包含与所述关键信息相匹配的信息;
展示所述搜索结果。
2.根据权利要求1所述的方法,其特征在于,所述关键信息包括关键词信息和/或关键语句信息;
所述关键词信息包括一个关键词或多个关键词的逻辑组合;
所述关键语句信息包括一个关键语句或多个关键语句的逻辑组合。
3.根据权利要求2所述的方法,其特征在于,所述第一网页包含与所述关键信息相匹配的信息是指:
在所述关键信息包含关键词信息时,所述第一网页存在如下情况:
在所述关键词信息为一个关键词时,所述第一网页中包含该关键词或该关键词的近义词;在所述关键词信息为多个关键词的逻辑组合时,所述第一网页中包含该多个关键词或其近义词的逻辑组合;
在所述关键信息包含关键语句信息时,所述第一网页中包含与该关键语句信息相同文字比例达到预设阈值的语句。
4.根据权利要求1所述的方法,其特征在于,在网络中搜索第一网页的步骤,包括:
在网络内的满足预设条件的网页中搜索第一网页;
所述预设条件包括:
条件一、该网页所在网站的域名没有存储在侵权网站数据库中;或,该网页所在网站的域名已存储在所述侵权网站数据库中但所述网站的域名存储在预设的例外名单中,且该网页没有收录到侵权网站数据库中;
其中,所述侵权网站数据库用于收录经过识别的侵权网站的域名以及该网站下侵权网页的网址,所述例外名单用于存储域名已存储在侵权网站数据库中但仍需对其进行搜索的网站域名;
条件二、该网页所在网站不是所述目标网站;
以及条件三、当前的搜索结果中不包含与该网页在同一域名下的相关网页。
5.根据权利要求1所述的方法,其特征在于,所述展示所述搜索结果,包括:
在检测到用户登录到指定的结果查看账户后,按预设规则向该账户展示所述搜索结果;
所述预设规则包括:
若从上次查看结束时刻到本次查看开始时刻之间这一时间段内搜索发现第一网页,则最先展示所述时间段内发现的第一网页所在的网站;若未搜索发现,则显示暂未发现最新;
还包括:将上次查看结束时刻之前发现的第一网页以链接的方式排列展示。
6.根据权利要求1所述的方法,其特征在于,所述方法还包括:
在检测到用户确定所述第一页面所在网站为侵权网站的确定操作后,将所述第一页面所在网站的域名以及该第一页面的网址收录到侵权网站数据库中;
所述侵权网站数据库用于收录经过识别的侵权网站的域名以及该网站下侵权网页的网址。
7.根据权利要求6所述的方法,其特征在于,所述方法还包括在所述目标网站的服务器处执行如下步骤,包括:
在检测到未知网站向所述目标网站发出的调用请求时,判断所述未知网站的域名是否存在于所述侵权网站数据库中;
若确定存在,则按如下方式中的任意一种方式执行:
方式一、禁止所述未知网站调用所述目标网站,使得所述未知网站无法打开所述目标网站的链接;
方式二、向用户展示告警提示语,所述告警提示语用于说明所述未知网站为侵权网站,还用于说明允许所述未知网站调用的后果;接收用户触发的对于所述未知网站的操作,执行对应的操作。
8.一种侵权网站搜索识别装置,其特征在于,应用于鉴别服务器处,所述装置包括:
关键信息确定模块,用于确定目标网站对应的关键信息,所述关键信息为描述目标网站特定业务的信息;
网页搜索模块,用于根据所述关键信息,在鉴别服务器上基于专用网络爬虫搜索系统,在网络中搜索第一网页得到搜索结果,所述第一网页包含与所述关键信息相匹配的信息;
结果展示模块,用于展示所述搜索结果。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于秦德玉,未经秦德玉许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201810425143.5/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种索引树建立方法以及图像检索方法
- 下一篇:一种基于大数据的广告选词方法