[发明专利]使用频繁模式挖掘的浏览节点创建有效
申请号: | 201780050415.1 | 申请日: | 2017-08-16 |
公开(公告)号: | CN109564570B | 公开(公告)日: | 2023-05-30 |
发明(设计)人: | 亚历山大·志凯列维奇;吉奥拉·西姆霍尼;阿尔农·达冈;丹尼尔·赫维茨 | 申请(专利权)人: | 电子湾有限公司 |
主分类号: | G06F16/28 | 分类号: | G06F16/28 |
代理公司: | 中科专利商标代理有限责任公司 11021 | 代理人: | 黄亮 |
地址: | 美国加利*** | 国省代码: | 暂无信息 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 浏览节点页面是通过其路径来寻址的。结果,与相应的基于参数的搜索页面相比,网络爬虫有更大可能找到浏览节点。可以通过使用标题或标头元标签来进一步区分浏览节点和搜索结果页面,该标题或标头元标签指示关于浏览节点的信息并且将浏览节点与一般搜索结果页面区分开。关键字、类别和关键字‑值对的组合的数量使得在除了最简单的应用之外的所有应用中针对每个可能的组合创建浏览节点都是令人望而却步的。本文公开了用于识别哪些搜索结果页面应被转换为浏览节点的方法和系统。 | ||
搜索关键词: | 使用 频繁 模式 挖掘 浏览 节点 创建 | ||
【主权项】:
1.一种方法,包括:访问表示多个项目的数据;针对所述多个项目中的每个项目,访问与所述项目相关联的关键字‑值对集合;从所述关键字‑值对集合中选择第一关键字‑值对;确定所述多个项目中与所述第一关键字‑值对相关联的第一数量的项目;将所述第一数量与阈值进行比较以生成结果;以及基于所述结果,针对所述第一关键字‑值对创建浏览节点,所述浏览节点包括引用所述第一关键字‑值对的值的标题。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于电子湾有限公司,未经电子湾有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201780050415.1/,转载请声明来源钻瓜专利网。
- 上一篇:减少用于长期计算的存储器使用
- 下一篇:利用搜索上下文的查询推荐方法及系统