[发明专利]一种用于对网页进行评估的方法、装置和设备有效
申请号: | 201210343159.4 | 申请日: | 2012-09-14 |
公开(公告)号: | CN102880688A | 公开(公告)日: | 2013-01-16 |
发明(设计)人: | 武鹏程;戴文渊;夏威 | 申请(专利权)人: | 北京百度网讯科技有限公司 |
主分类号: | G06F17/30 | 分类号: | G06F17/30 |
代理公司: | 北京汉昊知识产权代理事务所(普通合伙) 11370 | 代理人: | 罗朋 |
地址: | 100085 北京市*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 用于 网页 进行 评估 方法 装置 设备 | ||
1.一种计算机实现的用于对网页进行评估的方法,其中,所述网页包括多项特征相关信息,所述方法包括以下步骤:
a 获取待建立网页评估模型的一组目标样本组以及与其对应的至少一组参照样本组,其中,所述目标样本组及其对应的至少一组参照样本组分别包括多个网页;
b 根据所述目标样本组以及所述至少一组参照样本组,获得所述至少一组参照样本组中部分或全部参照样本组相对于所述目标样本组的权重调整信息;
c 根据所述目标样本组、各个参照样本组所对应的所述权重调整信息以及所述预定训练方式来执行迁移操作,获得所述目标样本组的网页评估模型;
d 基于所述网页评估模型对一个或多个待评估网页进行评估。
2.根据权利要求1所述的方法,其中,所述权重调整信息包括所述至少一组参照样本组中各个参照样本组分别相对于所述目标样本组的分组权重信息;其中,步骤b包括:
-对每个参照样本组的每项特征相关信息,获取该组特征相关信息相对于目标样本组的该项特征相关信息的第一相似度,以根据该第一相似度来确定每个参照组相对于目标样本组的分组权重信息;
其中,所述步骤c包括:
-根据各个参照样本组的分组权重信息,对各个参照样本组中的各个网页的特征相关信息进行调整,以获得调整后的各个网页的特征相关信息;
-基于所述目标样本组和所述参照样本组的调整后的特征相关信息采用预定训练方式进行训练,以获得与所述目标样本组的网页相适应的网页评估模型。
3.根据权利要求1所述的方法,其中,所述权重调整信息包括模型权重信息,所述步骤b包括以下步骤:
-获取与所述目标样本组以及各个参照样本组分别对应的、基于预定训练方式所获得的初始评估模型;
-获取各个参照样本组的初始评估模型分别相对于所述目标样本组的网页的模型权重信息;
其中,步骤c包括以下步骤:
-根据所述各个参照样本组的初始评估模型及其模型权重信息,对所述目标组的初始评估模型进行调整,以获得与所述目标样本组相适应的网页评估模型。
4.根据权利要求1所述的方法,其中,所述权重调整信息包括差值权重模型,所述步骤b包括以下步骤:
b1根据所述目标样本组、所述至少一组参照样本组以及所述预定训练方式,获得用于执行迁移操作的差值权重模型;
其中,所述步骤c包括以下步骤:
-采用所述预定训练方式对所述目标样本组的网页进行训练,以获得初始评估模型;
-根据所述先验评估模型以及所述差值权重模型,对所述初始评估模型进行调整,以获得与该目标样本组的网页相适应的网页评估模型。
5.根据权利要求4所述的方法,其中,所述步骤b1包括以下步骤:
-对所述目标样本组及其对应的至少一组参照样本组采用所述预定训练方式进行训练,以获得先验评估模型;
-基于所述先验评估模型,基于所述目标样本组继续执行训练,以获得差值评估模型;
-根据所述先验评估模型以及所述差值评估模型确定差值权重模型。
6.根据权利要求1至5中任一项所述的方法,其中,所述步骤a包括以下步骤:
-根据一项或多项特征相关信息将多个网页划分为多个样本组;
-由所划分的多组网页中选择至少一组作为所述目标样本组;
其中,对所选择的每个目标样本组,还执行以下步骤:
a1由剩余的其他组网页中选择一组或多组作为与该目标样本组对应的参照样本组。
7.根据权利要求6所述的方法,其中,所述步骤a1包括以下步骤:
-确定剩余的其他组网页中的一组或多组与该目标样本组之间的第二相似度;
-根据所述第二相似度,并基于预定选择规则,由所述一组或多组网页中选择与所述目标样本组相似的至少一组网页,作为所述目标样本组的参照样本组。
8.根据权利要求1至7中任一项所述的方法,其中,所述步骤d包括以下步骤:
-获取待评估网页的特征相关信息;
-根据所获得的特征相关信息,确定该待评估网页所对应的目标样本组;
-基于与目标该样本组对应的网页评估模型对该待评估网页执行评估操作。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京百度网讯科技有限公司,未经北京百度网讯科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201210343159.4/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种嵌入GIS的医疗服务信息检索平台
- 下一篇:一种家谱创建及管理方法