[发明专利]知识图谱构建方法、装置、设备以及存储介质有效
申请号: | 202010345691.4 | 申请日: | 2020-04-27 |
公开(公告)号: | CN111522967B | 公开(公告)日: | 2023-09-15 |
发明(设计)人: | 李千;史亚冰;蒋烨;柴春光;朱勇 | 申请(专利权)人: | 北京百度网讯科技有限公司 |
主分类号: | G06F16/36 | 分类号: | G06F16/36 |
代理公司: | 北京品源专利代理有限公司 11332 | 代理人: | 孟金喆 |
地址: | 100085 北京市*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 知识 图谱 构建 方法 装置 设备 以及 存储 介质 | ||
1.一种知识图谱构建方法,其特征在于,包括:
确定与实体关联的目标数据源;
从所述目标数据源的数据中提取场景元素,并确定场景;
根据所述实体与所述场景元素的关联关系,以及所述实体与属性标签的关联关系,确定所述场景元素与所述属性标签之间的关联信息;
根据所述场景元素与所述属性标签之间的关联信息,从所述属性标签中确定目标标签,其中,属性标签是描述实体属性的标签;目标标签是指与场景关联的标签;
建立场景节点与目标标签节点之间的边,得到包括场景信息的知识图谱;
所述根据所述场景元素与所述属性标签之间的关联信息,从所述属性标签中确定所述目标标签之前,还包括:根据已有知识图谱中实体节点和场景元素节点之间的边,确定所述实体与所述场景元素的所述关联关系;根据已有知识图谱中所述实体节点和属性标签节点的边,确定所述实体与所述属性标签的所述关联关系。
2.根据权利要求1所述的方法,其特征在于,所述根据所述场景元素与所述属性标签之间的关联信息,从所述属性标签中确定所述目标标签,包括:
根据所述场景元素与所述属性标签之间的关联次数,从所述属性标签中确定所述目标标签。
3.根据权利要求2所述的方法,其特征在于,所述根据所述场景元素与所述属性标签之间的关联次数,从所述属性标签中确定所述目标标签,包括:
若所述场景元素与所述属性标签之间的关联次数大于设定次数阈值,则将该属性标签作为候选标签;
根据所述场景元素与所述候选标签之间的关联次数,确定所述候选标签与所述场景的相关度;
根据所述相关度,从所述候选标签中确定所述目标标签。
4.根据权利要求3所述的方法,其特征在于,所述根据所述场景元素与所述候选标签之间的关联次数,确定所述候选标签与所述场景的相关度,包括:
确定所述场景元素与所述候选标签之间关联次数的最大值;
计算所述场景元素与所述候选标签之间的关联次数与所述最大值的比值;
根据计算的比值,确定所述候选标签与所述场景的相关度。
5.根据权利要求1-4中任一所述的方法,其特征在于,所述确定场景,包括:
根据所述场景元素确定所述场景;或,
根据需求信息确定所述场景。
6.根据权利要求1-4中任一所述的方法,其特征在于,所述场景元素为构成所述场景的要素中的至少一个;
所述场景的要素包括:所述场景下的人群、所述场景的发生地点和所述场景的发生时间。
7.一种知识图谱构建装置,其特征在于,包括:
场景确定模块,用于确定与实体关联的目标数据源,从所述目标数据源的数据中提取场景元素,以及确定场景;
目标标签确定模块,其中,
信息确定单元,用于根据所述实体与所述场景元素的关联关系,以及所述实体与属性标签的关联关系,确定所述场景元素与所述属性标签之间的关联信息;
目标标签确定单元,用于根据所述场景元素与所述属性标签之间的关联信息,从所述属性标签中确定所述目标标签;
图谱建立模块,用于建立场景节点与目标标签节点之间的边,得到包括场景信息的知识图谱;
场景关系确定模块,用于所述根据所述场景元素与所述属性标签之间的关联信息,从所述属性标签中确定所述目标标签之前,根据已有知识图谱中实体节点和场景元素节点之间的边,确定所述实体与所述场景元素的所述关联关系;
标签关系确定模块,用于根据已有知识图谱中所述实体节点和属性标签节点的边,确定所述实体与所述属性标签的所述关联关系。
8.根据权利要求7所述的装置,其特征在于,所述目标标签确定单元,包括:
标签确定子单元,用于根据所述场景元素与所述属性标签之间的关联次数,从所述属性标签中确定所述目标标签。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京百度网讯科技有限公司,未经北京百度网讯科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010345691.4/1.html,转载请声明来源钻瓜专利网。