[发明专利]更新知识图谱的方法及装置有效
申请号: | 201710568835.0 | 申请日: | 2017-07-13 |
公开(公告)号: | CN110019823B | 公开(公告)日: | 2023-03-28 |
发明(设计)人: | 胡于响 | 申请(专利权)人: | 阿里巴巴集团控股有限公司 |
主分类号: | G06F16/36 | 分类号: | G06F16/36;G06F16/23;G06F16/22 |
代理公司: | 北京鼎佳达知识产权代理事务所(普通合伙) 11348 | 代理人: | 王伟锋;刘铁生 |
地址: | 英属开曼群岛大开*** | 国省代码: | 暂无信息 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 更新 知识 图谱 方法 装置 | ||
1.一种更新知识图谱的方法,其特征在于,所述方法包括:
为知识图谱的数据层中实体的属性设置变化周期;
基于当前时间以及所述属性的变化周期,确定所述属性所对应的属性值的下次更新时间;
根据所述属性值的下次更新时间,更新所述数据层中对应的属性值;
所述为知识图谱的数据层中实体的属性设置变化周期包括:
提取所述知识图谱的模式层中实体的属性;
接收为所述属性设置的变化周期;
根据为所述模式层中所述属性设置的变化周期,为所述数据层中所述属性设置变化周期。
2.根据权利要求1所述的方法,其特征在于,所述根据所述属性值的下次更新时间,更新所述数据层中对应的属性值包括:
若确定到达所述属性值的下次更新时间,则通过爬取网络数据更新所述数据层中对应的属性值。
3.根据权利要求2所述的方法,其特征在于,所述若确定到达所述属性值的下次更新时间,则通过爬取网络数据更新所述数据层中对应的属性值包括:
建立索引数据库,所述索引数据库包括所述数据层中的实体、实体的属性、属性的变化周期、下次更新时间、爬取网络数据所需的爬虫参数之间的对应关系;
扫描所述索引数据库,从中筛选出与当前扫描时间相同的下次更新时间;
根据筛选出的下次更新时间对应的爬虫参数,爬取对应属性的属性值,并将爬取的属性值替换所述数据层中对应的属性值。
4.根据权利要求3所述的方法,其特征在于,所述将爬取的属性值替换所述数据层中对应的属性值包括:
根据所述索引数据库中筛选出的下次更新时间对应的实体、实体的属性,查找所述知识图谱的数据层中对应的属性值;
将所述爬取的属性值替换查找到的属性值。
5.根据权利要求3所述的方法,其特征在于,所述方法还包括:
当所述索引数据库中还包括属性值时,将所述爬取的属性值替换所述索引数据库中对应的属性值。
6.根据权利要求3所述的方法,其特征在于,在根据所述属性值的下次更新时间,更新所述数据层中对应的属性值之后,所述方法还包括:
基于属性的变化周期,更新所述属性对应的下次更新时间。
7.根据权利要求6所述的方法,其特征在于,当所述索引数据库中还包括用于指示变化周期是否会动态变化的周期特征以及变化周期的更新次数时,所述基于属性的变化周期,更新所述属性对应的下次更新时间包括:
若所述周期特征为固定不变,则基于所述周期特征对应的当前的变化周期,更新对应的下次更新时间;
若所述周期特征为动态变化,则基于预设周期更新算法以及所述周期特征对应的更新次数,更新所述周期特征对应的变化周期,并基于更新后的变化周期,更新对应的下次更新时间。
8.根据权利要求7所述的方法,其特征在于,所述基于预设周期更新算法以及所述周期特征对应的更新次数,更新所述周期特征对应的变化周期包括:
根据所述周期特征对应的爬取的属性值与所述周期特征对应的原始的属性值之间的差异,调整所述周期特征对应的更新次数;
将调整后的更新次数作为所述预设周期更新算法的输入参数,计算更新后的变化周期。
9.根据权利要求8所述的方法,其特征在于,所述预设周期更新算法为递增函数,且变化周期随着更新次数的增大而增大;
或者,所述预设周期更新算法为递减函数,且变化周期随着更新次数的减小而增大。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于阿里巴巴集团控股有限公司,未经阿里巴巴集团控股有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201710568835.0/1.html,转载请声明来源钻瓜专利网。