[发明专利]用于网页输出选择的计算系统、方法和机器可读非暂时性存储介质有效
申请号: | 201380077007.7 | 申请日: | 2013-05-29 |
公开(公告)号: | CN105247481B | 公开(公告)日: | 2019-05-07 |
发明(设计)人: | S.吴;J.刘 | 申请(专利权)人: | 惠普发展公司;有限责任合伙企业 |
主分类号: | G06F16/957 | 分类号: | G06F16/957;G06F17/22 |
代理公司: | 中国专利代理(香港)有限公司 72001 | 代理人: | 王洪斌;张涛 |
地址: | 美国德*** | 国省代码: | 美国;US |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 网页 输出 选择 | ||
1.一种计算系统,包括:
存储关于网页的之前输出选择的信息的存储装置,其中输出选择包括打印、数字剪辑、传输和存储中的至少一个;以及
处理器,用于:
根据包括特征的之前输出选择的区段的频率为输出选择的特征加权;
向网页树的不同区段分配得分,其中得分基于特征值,该特征值基于存在于所述不同区段中的特征和存在特征的权重;
基于不同区段的得分确定要输出的区段;以及
使所确定的区段被输出。
2.如权利要求1所述的计算系统,其中处理器还对具有要输出的所确定区段的内容分组。
3.如权利要求2所述的计算系统,其中处理器还基于区段的空间对准对要输出的内容分组。
4.如权利要求3所述的计算系统,其中将具有大于关于所选区段的阈值的重叠区域的内容确定为在空间上对准并且其中选择在空间上对准的内容以用于与所选区段一起输出。
5.如权利要求1所述的计算系统,其中处理器还确定与特征相关联的多个权重,其中权重均与不同类型的网页和不同类型的用户中的至少一个相关联。
6.一种方法,包括:
通过处理器确定网页区段的特征;
基于用于确定权重的机器学习方法分别向每一个特征分配权重;
基于特征的权重确定针对区段的得分;以及
基于得分确定输出区段。
7.如权利要求6所述的方法,还包括基于具有包括所选区段的附加内容的不同分组来为网页的不同区段评分。
8.如权利要求6所述的方法,还包括基于网页类型和用户类型中的至少一个确定向特征分配的权重。
9.如权利要求6所述的方法,其中区段包括表示网页的树结构的区段。
10.如权利要求6所述的方法,其中机器学习方法包括基于由多个用户输出的涉及其它网页的输出选择确定用于不同特征的权重。
11.一种机器可读非暂时性存储介质,包括由处理器可执行的指令用于:
基于与网页的之前输出部分相关联的文档对象模型节点的特征确定与网页文档对象模型节点的不同特征相关联的权重;
确定所选网页的节点的特征;
基于与所确定的每一个节点的特征相关联的权重为所选网页的每一个节点评分;
基于节点的得分选择要输出的所选网页的文档对象模型节点的子集;以及
使与节点的子集相关联的网页区段被输出。
12.如权利要求11所述的机器可读非暂时性存储介质,其中特征包括以下中的至少一个:定位、区域大小、字体颜色、字体大小、字体类型、文本区域和链接数目。
13.如权利要求11所述的机器可读非暂时性存储介质,还包括指令以从所选节点遍历深度第一搜索中的文档对象模型节点从而基于深度第一搜索中的节点之间的空间对准来确定要分组在一起以用于输出的节点。
14.如权利要求13所述的机器可读非暂时性存储介质,还包括指令以基于分组中的节点的合计得分和由节点表示的网页区域选择节点分组。
15.如权利要求11所述的机器可读非暂时性存储介质,其中确定权重的指令包括应用机器学习方法以确定特征包括在选择用于输出的文档对象模型节点中的统计可能性的指令。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于惠普发展公司,有限责任合伙企业,未经惠普发展公司,有限责任合伙企业许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201380077007.7/1.html,转载请声明来源钻瓜专利网。