[发明专利]用于处理信息的方法和装置有效

专利信息
申请号: 201810975593.1 申请日: 2018-08-24
公开(公告)号: CN110895548B 公开(公告)日: 2022-08-09
发明(设计)人: 刘畅;张阳;谢奕;杨双全;熊云;郑灿翔;季昆鹏;张雪婷 申请(专利权)人: 百度在线网络技术(北京)有限公司
主分类号: G06F16/28 分类号: G06F16/28
代理公司: 北京英赛嘉华知识产权代理有限责任公司 11204 代理人: 王达佐;马晓亚
地址: 100085 北京市*** 国省代码: 北京;11
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 用于 处理 信息 方法 装置
【说明书】:

本申请实施例公开了用于处理信息的方法和装置。该方法的一具体实施方式包括:获取至少一条日志,其中,日志包括至少一个实体的实体信息。对于至少一条日志中的日志,按照预定的实体抽取配置规则基于该日志生成原始边。对于所生成的至少一个原始边所涉及的至少一个实体中的实体,通过预设的顶点标识字典获取该实体对应的顶点标识。对于至少一个原始边中的原始边,获取该原始边包括的两个实体对应的顶点标识,根据该原始边的边信息、两个实体对应的顶点标识和两个实体的实体信息生成关联边。该实施方式能够从海量时空数据中快速、准确地抽取出实体间的关系,并且便于存储和查找实体间的关系。

技术领域

本申请实施例涉及计算机技术领域,具体涉及用于处理信息的方法和装置。

背景技术

随着移动互联网的发展,现实世界中的人和事物之间都存在直接或者间接的联系,即万物互联。挖掘和获取这些关系对各个领域都有重大的意义。比如金融领域,银行和券商可以根据人与人之间的关系,进行金融产品的推荐和风险喜好的评估。比如团购和点评类网站和 app,通过人与常驻地的关系,以及常去餐厅的关系,能进行产品推荐,增加广告转化率。比如公安领域,通过人与人、人与地点、人与事物之间的关系,梳理犯罪线索,提高办案效率,或者挖掘群体关系,对一些群体事件、恐怖事件进行预测和提前准备。上述提到的人、地点、事物等统称为实体,挖掘实体之间的关系具有很大的现实意义。得益于现实世界中的采集装置和传感器的普及,以及各种手持设备和穿戴设备的普及,人们可以获取大量结构化的实体轨迹和实体日志信息,从这些浩如烟海的数据中挖掘实体和实体的关系,是极具挑战性的工作。

发明内容

本申请实施例提出了用于处理信息的方法和装置。

第一方面,本申请实施例提供了一种用于处理信息的方法,包括:获取至少一条日志,其中,日志包括至少一个实体的实体信息;对于至少一条日志中的日志,按照预定的实体抽取配置规则基于该日志生成原始边,其中,原始边包括两个实体的实体信息,实体与预设的图数据库中的顶点相对应,实体抽取配置规则用于指定原始边的两个实体的实体信息在日志中的位置、包括两个实体的关联边的边信息;对于所生成的至少一个原始边所涉及的至少一个实体中的实体,通过预设的顶点标识字典获取该实体对应的顶点标识,其中,顶点标识字典用于表征图数据库中的顶点的顶点标识与实体的实体信息之间的对应关系;对于至少一个原始边中的原始边,获取该原始边包括的两个实体对应的顶点标识,根据该原始边的边信息、两个实体对应的顶点标识和两个实体的实体信息生成关联边。

在一些实施例中,实体信息包括以下至少一项:实体标签、实体键和实体属性,边信息包括以下至少一项:边标签、边属性。

在一些实施例中,实体信息包括:实体标签和实体键;以及通过预设的顶点标识字典获取该实体对应的顶点标识,包括:确定预设的顶点标识字典中是否存在与该实体的实体信息中的实体标签和实体键相匹配的实体信息;若存在,则将相匹配的实体信息对应的顶点标识确定为该实体的顶点标识,以及更新顶点标识字典中该实体的实体信息。

在一些实施例中,该方法还包括:若不存在,则生成该实体的顶点标识,以及在顶点标识字典中新增所生成的该实体的顶点标识和该实体的实体信息之间的对应关系。

在一些实施例中,更新顶点标识字典中该实体的实体信息,包括:响应于检测出该实体的实体信息中的实体属性与顶点标识字典中该实体的实体信息中的实体属性不同,将该实体的实体信息中的实体属性与顶点标识字典中该实体的实体信息中的实体属性合并后作为顶点标识字典中该实体的实体信息中的实体属性。

在一些实施例中,按照预定的实体抽取配置规则基于该日志生成原始边,包括:根据预定的实体抽取配置规则中指定的原始边的两个实体的实体信息在该日志中的位置分别读取出两个实体的实体信息;按照预定的字段类型规则对所读取出两个实体的实体信息进行解析得到解析后的两个实体的实体信息,其中,字段类型规则用于指定实体信息中各字段的数据类型;根据解析后的两个实体的实体信息、实体抽取配置规则中的边信息生成原始边。

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于百度在线网络技术(北京)有限公司,未经百度在线网络技术(北京)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/201810975593.1/2.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top