[发明专利]一种更新提醒的方法及系统有效
申请号: | 200910087505.5 | 申请日: | 2009-06-23 |
公开(公告)号: | CN101788991A | 公开(公告)日: | 2010-07-28 |
发明(设计)人: | 高志;王小川 | 申请(专利权)人: | 北京搜狗科技发展有限公司 |
主分类号: | G06F17/30 | 分类号: | G06F17/30 |
代理公司: | 北京集佳知识产权代理有限公司 11227 | 代理人: | 高萍;逯长明 |
地址: | 100084 北京市海淀区中关*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 更新 提醒 方法 系统 | ||
1.一种更新提醒的方法,其特征在于,包括:
抓取网络资源;
通过获得所述网络资源的特定区域或特定区域和特定元素提取所述网络 资源的特定内容;所述特定区域根据所述网络资源的文档对象模型中子节点 的面积及所述子节点的相似节点的数量确定,其中,所述子节点的面积不大 于第一阈值,所述相似节点与所述子节点按照标签被分在同一组,且该组内 的所述子节点和所述相似节点的面积的和大于第二阈值;所述第一阈值和所 述第二阈值均不小于0.5;
将先后两次提取的所述网络资源的特定内容进行比对;
若所述特定内容有变化,则提醒用户所述网络资源的内容有更新。
2.根据权利要求1所述的方法,其特征在于,所述将先后两次提取的所 述网络资源的特定内容进行比对包括:
基于所述网络资源的HTML源代码,将先后两次提取的所述网络资源的 特定内容进行比对。
3.根据权利要求2所述的方法,其特征在于,所述基于网络资源的HTML 源代码,将先后两次提取的所述网络资源的特定内容进行比对包括:
基于所述网络资源对应的文档对象模型,将先后两次提取的所述网络资 源的特定内容进行比对。
4.根据权利要求3所述的更新提醒的方法,其特征在于,所述获得所述 网络资源的特定区域的方式包括以下任意一种:
通过特定区域确定方法获得所述网络资源的特定区域;或
通过用户自定义方式获得所述网络资源的特定区域;或
确定是否存在用户自定义方式,若存在则通过用户自定义获得所述网络 资源的特定区域,若不存在则通过特定区域确定方法获得所述网络资源的特 定区域;或
确定是否存在用户自定义方式,若存在则通过用户自定义获得所述网络 资源的特定区域;若不存在则从数据库中查找与所述网络资源的URL匹配的 特定区域;若没有查找到与所述网络资源的URL匹配的特定区域,则通过特 定区域确定方法获得所述网络资源的特定区域;其中,通过用户自定义方式 和特定区域确定方法获得所述网络资源的特定区域后,还包括将所述网络资 源的URL与该网络资源的特定区域之间的匹配关系存储到所述数据库中。
5.根据权利要求1所述的更新提醒的方法,其特征在于,所述根据所述 网络资源的文档对象模型中节点的面积及相似节点的数量确定所述网络资源 的特定区域,包括:
步骤1、按照当前节点的选定子节点的面积进行排序,将面积小于预设阈 值的子节点选出并执行步骤2;将面积大于等于预设阈值的子节点设置为当前 节点,继续执行步骤1;
步骤2、按照标签对所述选出的子节点进行分组,若存在组内的子节点个 数大于2且总面积大于预设阈值的分组,则标记该分组内所有子节点;否则按 照子节点的面积由大至小的顺序依次遍历子节点,并累加已遍历的子节点的 总面积,当已遍历的子节点的总面积大于预设阈值时,则标记所有遍历过的 子节点,所述阈值不低于0.5;
步骤3、将步骤2中所有已标记的节点输出,构成与所述网络资源的URL 匹配的特定区域。
6.根据权利要求4所述的更新提醒的方法,其特征在于,所述用户自定 义方式包括:
获取用户指定区域的坐标;
将所述坐标标记在页面的文档对象模型中;
所有已标记节点构成与所述页面的URL匹配的特定区域。
7.根据权利要求1所述的更新提醒的方法,其特征在于,所述通过获得 所述网络资源的特定区域得到特定内容还包括:获得所述网络资源的分页区 域,根据该分页区域确定所述网络资源的分页属性,提取所有分页对应的特 定内容。
8.根据权利要求1所述的更新提醒的方法,其特征在于,所述获得所述 网络资源的特定元素包括:
获取用户指定的所述网络资源的元素的坐标;
将所述坐标标记在所述网络资源的文档对象模型中;
通过标记的所述文档对象模型中的节点信息找到所述网络资源的特定元 素。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京搜狗科技发展有限公司,未经北京搜狗科技发展有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/200910087505.5/1.html,转载请声明来源钻瓜专利网。