[发明专利]网页内容溯源方法、知识图谱构建方法以及相关设备在审
申请号: | 202111113469.2 | 申请日: | 2021-09-18 |
公开(公告)号: | CN115840863A | 公开(公告)日: | 2023-03-24 |
发明(设计)人: | 党倩 | 申请(专利权)人: | 华为技术有限公司 |
主分类号: | G06F16/958 | 分类号: | G06F16/958;G06F16/36 |
代理公司: | 深圳市赛恩倍吉知识产权代理有限公司 44334 | 代理人: | 陈敬华;常云敏 |
地址: | 518129 广东*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 网页 内容 溯源 方法 知识 图谱 构建 以及 相关 设备 | ||
本申请实施例提供了网页内容溯源方法、知识图谱构建方法以及相关设备,涉及终端领域;本申请中的计算机设备可以构建知识图谱,知识图谱中包括多个实体、以及实体之间的关系,然后可以基于知识图谱进行网页内容溯源,在知识图谱中确定待溯源网页对应的第一网页实体,在知识图谱中确定第一网页实体对应的至少一个目标实体,目标实体与第一网页实体之间存在直接或间接的关系,最后可以基于至少一个目标实体、第一网页实体与至少一个目标实体之间的关系展示待溯源网页的内容溯源结果;本申请可以实现自动化网页内容溯源,提升网页内容溯源效率。
技术领域
本申请涉及终端技术领域,尤其涉及了网页内容溯源方法、知识图谱构建方法以及相关设备。
背景技术
当互联网上网页引用了来自其他网页的内容时,该网页一般会通过如“引用”、“图源”等文字标示出内容的出处,网页在标示出处时可以标示包含该引用信息的网站名称,比如,“数据来源X讯网”。
在实践过程中,若用户访问了一个包含引用内容的网页,想要根据网页上标示的出处对该网页的引用内容进行溯源,从而找到首次发布该引用内容的网页时,用户只能根据该网页上标示的出处,借助搜索引擎在网络上进行手动搜索和筛选,流程非常繁琐且效率低下。
发明内容
有鉴于此,有必要提供网页内容溯源方法、知识图谱构建方法以及相关设备,其可克服上述问题,实现自动化网页内容溯源,免去用户手动搜索溯源的过程,大幅提升网页内容溯源的效率。
第一方面,本申请的一实施例提供了一种网页内容溯源方法应用于服务器,方法包括:
查询待溯源网页在知识图谱中对应的第一网页实体,知识图谱包括多个实体、以及各个实体之间的关系;根据知识图谱以及第一网页实体确定至少一个目标实体,至少一个目标实体与第一网页实体之间存在直接或者间接的关系;确定待溯源网页的溯源结果,溯源结果包括至少一个目标实体对应的至少一个网页或网站以及每个网页或网站之间的关系。
通过采用该技术方案,可以借助知识图谱对待溯源网页进行自动溯源,有效提升网页内容溯源的效率。
在一种可能的实现方式中,多个实体包括至少一个网站实体和至少一个网页实体,实体之间的关系包括引用关系和/或归属关系,引用关系或者归属关系通过网站实体的关系属性或者网页实体的关系属性进行确定。
其中,关系属性可以包括引用对象属性和归属对象属性。
通过采用该技术方案,可以在知识图谱的多个网页实体和多个网站实体中,确定待溯源网页对应的第一网页实体,并根据归属关系和引用关系,确定第一网页实体存在直接或间接关系的目标实体,实现自动化网页溯源,提升内容溯源效率。
在一种可能的实现方式中,网页实体还包括网页地址属性,查询待溯源网页在知识图谱中对应的第一网页实体,包括:根据溯源网页的网页地址以及知识图谱中所有网页实体的网页地址属性,确定待溯源网页在知识图谱中对应的第一网页实体。
通过采用该技术方案,可以根据知识图谱中每个实体的网页地址属性的属性值(即网页地址)、以及待溯源网页的网页地址,精准确定待溯源网页在知识图谱中对应的第一网页实体。
在一种可能的实现方式中,网页实体还包括网页标识属性,查询待溯源网页在知识图谱中对应的第一网页实体,包括:根据待溯源网页的网页地址,生成待溯源网页对应的网页标识;根据待溯源网页对应的网页标识、以及知识图谱中所有网页实体的网页标识属性,确定待溯源网页在知识图谱中对应的第一网页实体。
通过采用该技术方案,可以由待溯源网页的网页地址生成待溯源网页的网页标识,并通过知识图中每个实体的网页标识属性的属性值(即网页标识),精准确定待溯源网页在知识图谱中对应的第一网页实体。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于华为技术有限公司,未经华为技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202111113469.2/2.html,转载请声明来源钻瓜专利网。
- 内容再现系统、内容提供方法、内容再现装置、内容提供装置、内容再现程序和内容提供程序
- 内容记录系统、内容记录方法、内容记录设备和内容接收设备
- 内容服务系统、内容服务器、内容终端及内容服务方法
- 内容分发系统、内容分发装置、内容再生终端及内容分发方法
- 内容发布、内容获取的方法、内容发布装置及内容传播系统
- 内容提供装置、内容提供方法、内容再现装置、内容再现方法
- 内容传输设备、内容传输方法、内容再现设备、内容再现方法、程序及内容分发系统
- 内容发送设备、内容发送方法、内容再现设备、内容再现方法、程序及内容分发系统
- 内容再现装置、内容再现方法、内容再现程序及内容提供系统
- 内容记录装置、内容编辑装置、内容再生装置、内容记录方法、内容编辑方法、以及内容再生方法