[发明专利]更新数据库中非永久性的关系数据的方法及系统有效
申请号: | 201510437705.4 | 申请日: | 2015-07-23 |
公开(公告)号: | CN105069045B | 公开(公告)日: | 2018-07-31 |
发明(设计)人: | 牛正雨;卢佳俊;刘锦文;顾珮嵚;王介峰 | 申请(专利权)人: | 百度在线网络技术(北京)有限公司 |
主分类号: | G06F17/30 | 分类号: | G06F17/30 |
代理公司: | 广州三环专利商标代理有限公司 44202 | 代理人: | 温旭;郝传鑫 |
地址: | 100085 北京市*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 更新 数据库 中非 永久性 关系 数据 方法 系统 | ||
1.一种更新数据库中非永久性的关系数据的方法,其特征在于,所述方法包括:
抓取网络中到当前时间点为止的预定时间段内增加或者更新的网页;
从抓取到的网页中提取关系类型属于待更新的数据库的非永久性关系集合的关系三元组数据;
根据提取出的关系三元组数据更新数据库中非永久性的关系数据,包括:
识别提取出的关系三元组数据的关系类型,
若所述关系类型识别为事件关系类型,则从更新规则库中获取与所述事件关系类型对应的更新规则,
根据获取的更新规则以及提取出的关系三元组数据,在所述数据库中定位待更新的非永久性的关系数据,
若定位成功,则在定位到的数据上执行基于所述提取出的关系三元组数据中的辅助信息以及所述获取的更新规则的数据处理。
2.如权利要求1所述的方法,其特征在于,
所述非永久性关系集合包括:所述待更新的数据库中的非永久性的关系类型以及所述非永久性的关系类型的关联关系类型。
3.如权利要求2所述的方法,其特征在于,所述方法还包括:
预先构建所述非永久性关系集合;
针对所述非永久性关系集合中的各元素分别构建相应的关系提取器集合。
4.如权利要求3所述的方法,其特征在于,从抓取到的网页中提取关系类型属于待更新的数据库的非永久性关系集合的关系三元组数据包括:
通过构建出的所述关系提取器集合从所述抓取到的网页中提取所述关系三元组数据。
5.如权利要求1所述的方法,其特征在于,根据提取出的关系三元组数据更新数据库中非永久性的关系数据还包括:
若定位失败,则在所述数据库中建立所述待更新的非永久性的关系数据,并在建立的数据上执行基于所述提取出的关系三元组数据中的辅助信息以及所述获取的更新规则的数据处理。
6.如权利要求1所述的方法,其特征在于,根据提取出的关系三元组数据更新数据库中非永久性的关系数据还包括:
若所述关系类型识别为非永久性的关系类型,则识别所述数据库中是否存在与提取出的关系三元组数据对应的关系数据;
若识别结果为不存在,则将提取出的关系三元组数据存储至所述数据库中。
7.如权利要求1所述的方法,其特征在于,所述方法还包括:
在执行根据提取出的关系三元组数据更新数据库中非永久性的关系数据的处理前,识别所述提取出的关系三元组数据是否为正确数据;
若所述关系三元组数据识别为是正确数据,则继续执行所述根据提取出的关系三元组数据更新数据库中非永久性的关系数据的处理;
若所述关系三元组数据识别为不是正确数据,则删除所述关系三元组数据。
8.如权利要求7所述的方法,其特征在于,识别所述提取出的关系三元组数据是否为正确数据包括:
判断是否不同的关系提取器均确定待识别的关系三元组数据的实体对的基于给定句子的关系类型为目标关系类型,若所述不同的关系提取器均确定待识别的关系三元组数据的实体对的基于给定句子的关系类型为目标关系类型,则确定所述待识别的关系三元组数据是正确数据,若存在确定待识别的关系三元组数据的实体对的基于给定句子的关系类型不为目标关系类型的关系提取器,则确定所述待识别的关系三元组数据不是正确数据;
或者,
获取待识别的关系三元组数据的累积提取次数,将获取的所述累积提取次数与预定阈值进行比较,若所述累积提取次数大于或者等于所述预定阈值,则确定所述待识别的关系三元组数据是正确数据,若所述累积提取次数小于所述预定阈值,则确定所述待识别的关系三元组数据不是正确数据。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于百度在线网络技术(北京)有限公司,未经百度在线网络技术(北京)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201510437705.4/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种热管真空管型太阳集热器
- 下一篇:供热装置