[发明专利]一种发现相似网站版块的方法、系统、介质及设备在审
申请号: | 201911350444.7 | 申请日: | 2019-12-24 |
公开(公告)号: | CN111078962A | 公开(公告)日: | 2020-04-28 |
发明(设计)人: | 张军 | 申请(专利权)人: | 北京海致星图科技有限公司 |
主分类号: | G06F16/903 | 分类号: | G06F16/903;G06F8/36 |
代理公司: | 北京化育知识产权代理有限公司 11833 | 代理人: | 涂琪顺 |
地址: | 100000 北京市海淀*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明涉及一种发现相似网站版块的方法、系统、介质及设备,该方法包括:获取已知站点和对比站点的版块的网页内容;分别根据所述已知站点和对比站点的版块的网页内容生成第一摘要字符串组和第二摘要字符串组;对所述第一摘要字符串组和第二摘要字符串组进行对应性相似度计算,如果达到指定阈值,则记录所述对比站点对应的相似度值。本发明在某站点版块采集程序开发完成的基础上,可用于相似结构网站批量发现和规模性复用,达到开发一个,覆盖多个的效果,最终提高开发整体效率。 | ||
搜索关键词: | 一种 发现 相似 网站 版块 方法 系统 介质 设备 | ||
【主权项】:
暂无信息
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京海致星图科技有限公司,未经北京海致星图科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201911350444.7/,转载请声明来源钻瓜专利网。