[发明专利]网页内容溯源方法、知识图谱构建方法以及相关设备在审

专利信息
申请号: 202111113469.2 申请日: 2021-09-18
公开(公告)号: CN115840863A 公开(公告)日: 2023-03-24
发明(设计)人: 党倩 申请(专利权)人: 华为技术有限公司
主分类号: G06F16/958 分类号: G06F16/958;G06F16/36
代理公司: 深圳市赛恩倍吉知识产权代理有限公司 44334 代理人: 陈敬华;常云敏
地址: 518129 广东*** 国省代码: 广东;44
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 网页 内容 溯源 方法 知识 图谱 构建 以及 相关 设备
【说明书】:

本申请实施例提供了网页内容溯源方法、知识图谱构建方法以及相关设备,涉及终端领域;本申请中的计算机设备可以构建知识图谱,知识图谱中包括多个实体、以及实体之间的关系,然后可以基于知识图谱进行网页内容溯源,在知识图谱中确定待溯源网页对应的第一网页实体,在知识图谱中确定第一网页实体对应的至少一个目标实体,目标实体与第一网页实体之间存在直接或间接的关系,最后可以基于至少一个目标实体、第一网页实体与至少一个目标实体之间的关系展示待溯源网页的内容溯源结果;本申请可以实现自动化网页内容溯源,提升网页内容溯源效率。

技术领域

本申请涉及终端技术领域,尤其涉及了网页内容溯源方法、知识图谱构建方法以及相关设备。

背景技术

当互联网上网页引用了来自其他网页的内容时,该网页一般会通过如“引用”、“图源”等文字标示出内容的出处,网页在标示出处时可以标示包含该引用信息的网站名称,比如,“数据来源X讯网”。

在实践过程中,若用户访问了一个包含引用内容的网页,想要根据网页上标示的出处对该网页的引用内容进行溯源,从而找到首次发布该引用内容的网页时,用户只能根据该网页上标示的出处,借助搜索引擎在网络上进行手动搜索和筛选,流程非常繁琐且效率低下。

发明内容

有鉴于此,有必要提供网页内容溯源方法、知识图谱构建方法以及相关设备,其可克服上述问题,实现自动化网页内容溯源,免去用户手动搜索溯源的过程,大幅提升网页内容溯源的效率。

第一方面,本申请的一实施例提供了一种网页内容溯源方法应用于服务器,方法包括:

查询待溯源网页在知识图谱中对应的第一网页实体,知识图谱包括多个实体、以及各个实体之间的关系;根据知识图谱以及第一网页实体确定至少一个目标实体,至少一个目标实体与第一网页实体之间存在直接或者间接的关系;确定待溯源网页的溯源结果,溯源结果包括至少一个目标实体对应的至少一个网页或网站以及每个网页或网站之间的关系。

通过采用该技术方案,可以借助知识图谱对待溯源网页进行自动溯源,有效提升网页内容溯源的效率。

在一种可能的实现方式中,多个实体包括至少一个网站实体和至少一个网页实体,实体之间的关系包括引用关系和/或归属关系,引用关系或者归属关系通过网站实体的关系属性或者网页实体的关系属性进行确定。

其中,关系属性可以包括引用对象属性和归属对象属性。

通过采用该技术方案,可以在知识图谱的多个网页实体和多个网站实体中,确定待溯源网页对应的第一网页实体,并根据归属关系和引用关系,确定第一网页实体存在直接或间接关系的目标实体,实现自动化网页溯源,提升内容溯源效率。

在一种可能的实现方式中,网页实体还包括网页地址属性,查询待溯源网页在知识图谱中对应的第一网页实体,包括:根据溯源网页的网页地址以及知识图谱中所有网页实体的网页地址属性,确定待溯源网页在知识图谱中对应的第一网页实体。

通过采用该技术方案,可以根据知识图谱中每个实体的网页地址属性的属性值(即网页地址)、以及待溯源网页的网页地址,精准确定待溯源网页在知识图谱中对应的第一网页实体。

在一种可能的实现方式中,网页实体还包括网页标识属性,查询待溯源网页在知识图谱中对应的第一网页实体,包括:根据待溯源网页的网页地址,生成待溯源网页对应的网页标识;根据待溯源网页对应的网页标识、以及知识图谱中所有网页实体的网页标识属性,确定待溯源网页在知识图谱中对应的第一网页实体。

通过采用该技术方案,可以由待溯源网页的网页地址生成待溯源网页的网页标识,并通过知识图中每个实体的网页标识属性的属性值(即网页标识),精准确定待溯源网页在知识图谱中对应的第一网页实体。

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于华为技术有限公司,未经华为技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/202111113469.2/2.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top