[发明专利]用于处理信息的方法和装置有效
申请号: | 201810975593.1 | 申请日: | 2018-08-24 |
公开(公告)号: | CN110895548B | 公开(公告)日: | 2022-08-09 |
发明(设计)人: | 刘畅;张阳;谢奕;杨双全;熊云;郑灿翔;季昆鹏;张雪婷 | 申请(专利权)人: | 百度在线网络技术(北京)有限公司 |
主分类号: | G06F16/28 | 分类号: | G06F16/28 |
代理公司: | 北京英赛嘉华知识产权代理有限责任公司 11204 | 代理人: | 王达佐;马晓亚 |
地址: | 100085 北京市*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 用于 处理 信息 方法 装置 | ||
本申请实施例公开了用于处理信息的方法和装置。该方法的一具体实施方式包括:获取至少一条日志,其中,日志包括至少一个实体的实体信息。对于至少一条日志中的日志,按照预定的实体抽取配置规则基于该日志生成原始边。对于所生成的至少一个原始边所涉及的至少一个实体中的实体,通过预设的顶点标识字典获取该实体对应的顶点标识。对于至少一个原始边中的原始边,获取该原始边包括的两个实体对应的顶点标识,根据该原始边的边信息、两个实体对应的顶点标识和两个实体的实体信息生成关联边。该实施方式能够从海量时空数据中快速、准确地抽取出实体间的关系,并且便于存储和查找实体间的关系。
技术领域
本申请实施例涉及计算机技术领域,具体涉及用于处理信息的方法和装置。
背景技术
随着移动互联网的发展,现实世界中的人和事物之间都存在直接或者间接的联系,即万物互联。挖掘和获取这些关系对各个领域都有重大的意义。比如金融领域,银行和券商可以根据人与人之间的关系,进行金融产品的推荐和风险喜好的评估。比如团购和点评类网站和 app,通过人与常驻地的关系,以及常去餐厅的关系,能进行产品推荐,增加广告转化率。比如公安领域,通过人与人、人与地点、人与事物之间的关系,梳理犯罪线索,提高办案效率,或者挖掘群体关系,对一些群体事件、恐怖事件进行预测和提前准备。上述提到的人、地点、事物等统称为实体,挖掘实体之间的关系具有很大的现实意义。得益于现实世界中的采集装置和传感器的普及,以及各种手持设备和穿戴设备的普及,人们可以获取大量结构化的实体轨迹和实体日志信息,从这些浩如烟海的数据中挖掘实体和实体的关系,是极具挑战性的工作。
发明内容
本申请实施例提出了用于处理信息的方法和装置。
第一方面,本申请实施例提供了一种用于处理信息的方法,包括:获取至少一条日志,其中,日志包括至少一个实体的实体信息;对于至少一条日志中的日志,按照预定的实体抽取配置规则基于该日志生成原始边,其中,原始边包括两个实体的实体信息,实体与预设的图数据库中的顶点相对应,实体抽取配置规则用于指定原始边的两个实体的实体信息在日志中的位置、包括两个实体的关联边的边信息;对于所生成的至少一个原始边所涉及的至少一个实体中的实体,通过预设的顶点标识字典获取该实体对应的顶点标识,其中,顶点标识字典用于表征图数据库中的顶点的顶点标识与实体的实体信息之间的对应关系;对于至少一个原始边中的原始边,获取该原始边包括的两个实体对应的顶点标识,根据该原始边的边信息、两个实体对应的顶点标识和两个实体的实体信息生成关联边。
在一些实施例中,实体信息包括以下至少一项:实体标签、实体键和实体属性,边信息包括以下至少一项:边标签、边属性。
在一些实施例中,实体信息包括:实体标签和实体键;以及通过预设的顶点标识字典获取该实体对应的顶点标识,包括:确定预设的顶点标识字典中是否存在与该实体的实体信息中的实体标签和实体键相匹配的实体信息;若存在,则将相匹配的实体信息对应的顶点标识确定为该实体的顶点标识,以及更新顶点标识字典中该实体的实体信息。
在一些实施例中,该方法还包括:若不存在,则生成该实体的顶点标识,以及在顶点标识字典中新增所生成的该实体的顶点标识和该实体的实体信息之间的对应关系。
在一些实施例中,更新顶点标识字典中该实体的实体信息,包括:响应于检测出该实体的实体信息中的实体属性与顶点标识字典中该实体的实体信息中的实体属性不同,将该实体的实体信息中的实体属性与顶点标识字典中该实体的实体信息中的实体属性合并后作为顶点标识字典中该实体的实体信息中的实体属性。
在一些实施例中,按照预定的实体抽取配置规则基于该日志生成原始边,包括:根据预定的实体抽取配置规则中指定的原始边的两个实体的实体信息在该日志中的位置分别读取出两个实体的实体信息;按照预定的字段类型规则对所读取出两个实体的实体信息进行解析得到解析后的两个实体的实体信息,其中,字段类型规则用于指定实体信息中各字段的数据类型;根据解析后的两个实体的实体信息、实体抽取配置规则中的边信息生成原始边。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于百度在线网络技术(北京)有限公司,未经百度在线网络技术(北京)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201810975593.1/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种实体嵌入方法及装置
- 下一篇:一种数据拼接方法、装置、介质及电子设备
- 信息记录介质、信息记录方法、信息记录设备、信息再现方法和信息再现设备
- 信息记录装置、信息记录方法、信息记录介质、信息复制装置和信息复制方法
- 信息记录装置、信息再现装置、信息记录方法、信息再现方法、信息记录程序、信息再现程序、以及信息记录介质
- 信息记录装置、信息再现装置、信息记录方法、信息再现方法、信息记录程序、信息再现程序、以及信息记录介质
- 信息记录设备、信息重放设备、信息记录方法、信息重放方法、以及信息记录介质
- 信息存储介质、信息记录方法、信息重放方法、信息记录设备、以及信息重放设备
- 信息存储介质、信息记录方法、信息回放方法、信息记录设备和信息回放设备
- 信息记录介质、信息记录方法、信息记录装置、信息再现方法和信息再现装置
- 信息终端,信息终端的信息呈现方法和信息呈现程序
- 信息创建、信息发送方法及信息创建、信息发送装置