[发明专利]一种网络图片侵权在线监测方法有效
申请号: | 202010961065.8 | 申请日: | 2020-09-14 |
公开(公告)号: | CN112149063B | 公开(公告)日: | 2022-06-24 |
发明(设计)人: | 张金琳;孙宽慰;高航;俞学劢 | 申请(专利权)人: | 浙江数秦科技有限公司 |
主分类号: | G06F21/10 | 分类号: | G06F21/10;G06F16/58;G06Q50/18 |
代理公司: | 杭州杭诚专利事务所有限公司 33109 | 代理人: | 尉伟敏 |
地址: | 310012 浙江省杭州*** | 国省代码: | 浙江;33 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 网络 图片 侵权 在线 监测 方法 | ||
1.一种网络图片侵权在线监测方法,其特征在于,
包括以下步骤:
使用爬虫抓取网络上的网页,保存网页URL和网页代码,从网页URL获取网页域名,相同域名的网页纳入同一网站;
根据网站的访问量、历史侵权情况以及交互类型,设定网站的优先度,网站访问量大、历史侵权多以及交互程度高的网站的优先度高;
按网站优先度顺序抓取网站上的图片及图片URL,判断是否已存储相同URL的图片,若已存储则跳过该图片,反之,则下载该图片并以图片URL为索引存储;
将抓取到的图片与用户登记侵权监测的版权图片比对,若相似度超过设定阈值,则将图片及图片URL提供给用户;
设定网站的优先度的方法包括:
将优先度分为高优先度、普通优先度和低优先度,
设定网站日均访问量的阈值Vref,H和阈值Vref,L,Vref,H>Vref,L,若网站i的日均访问量Vi超过阈值Vref,H,则将网站i纳入高优先度集合,若网站i的日均访问量Vi低于阈值Vref,L,则将网站i纳入低优先度集合;
将历史侵权数量Hi超过设定阈值Href的网站i纳入高优先度集合;
将排版版式数量Ci超过设定阈值Cref的网站i纳入高优先度集合;
将允许用户上传并展示图片且网站日均访问量Vi超过阈值σ·Vref,H的网站纳入高优先度集合,其中σ为小于1的正数;
将未被纳入高优先度集合或低优先度集合的网站纳入普通优先度集合。
2.根据权利要求1所述的一种网络图片侵权在线监测方法,其特征在于,
设定网站的优先度pi的方法包括:
将网站日均访问量Vi归一化为V′i,
pi=(1+V′i)(aBBi+σCCi+σDyDyi+σWWi)
其中,Bi为网站i历史侵权数量,Ci为网站i的排版版式数量,Dyi为网站i是否允许用户上传并展示图片,若是则Dyi取值为1,若否则Dyi取值为0,Wi为网站i在搜索引擎的权重等级,Wi越大表示在搜索引擎的权重等级越高,σB、σC、σDy以及σW分别为各项的系数。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于浙江数秦科技有限公司,未经浙江数秦科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010961065.8/1.html,转载请声明来源钻瓜专利网。