[发明专利]一种数据处理的方法、装置、计算机存储介质及终端在审
申请号: | 201910113903.3 | 申请日: | 2019-02-14 |
公开(公告)号: | CN109918452A | 公开(公告)日: | 2019-06-21 |
发明(设计)人: | 陈媛;任鑫琦 | 申请(专利权)人: | 北京明略软件系统有限公司 |
主分类号: | G06F16/28 | 分类号: | G06F16/28 |
代理公司: | 北京安信方达知识产权代理有限公司 11262 | 代理人: | 王康;栗若木 |
地址: | 102218 北京市昌平区东小*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 计算机存储介质 图谱 数据模型 数据处理 构建 终端 数据检索 数据信息 分析 | ||
1.一种数据处理的方法,其特征在于,包括:
根据包括实体、关系和事件的数据信息,建立数据模型;
根据建立的数据模型构建知识图谱;
通过构建的知识图谱进行数据检索。
2.根据权利要求1所述的方法,其特征在于,所述建立数据模型之前,所述方法还包括通过以下方式获取所述实体:
对预先存储的源数据进行处理后,建立用于获取所述数据信息的知识库;
所述知识库中包含的所述源数据为结构化数据时,对所述源数据进行预处理后,通过预先设定的实体匹配规则构建所述实体;
所述知识库中包含的所述源数据为非结构化数据时,通过文本挖掘技术、或实体标注与识别技术对所述源数据进行处理后,构建所述实体。
3.根据权利要求1或2所述的方法,其特征在于,所述实体包括:物理实体和/或虚拟实体;
其中,所述物理实体包括以下一种或一种以上实体:人、车辆、房屋;所述虚拟实体包括以下一种或一种以上实体:组织机构、虚拟身份。
4.根据权利要求1或2所述的方法,其特征在于,所述实体包含以下一种或一种以上属性:
标签属性、自然属性、一个或一个以上主键属性;
其中,所述主键属性用于区分各实体;所述标签属性包括依据业务数据计算或归纳出的以下一种或一种以上特征:基础特征、行为特征、关系特征、地理位置;所述自然属性包括:从所述数据信息提取的属性值;所述属性值包括以下一种或一种以上属性信息:身高、年龄、籍贯;所述自然属性包括根据预设策略划分的主属性和/或副属性。
5.根据权利要求1所述的方法,其特征在于,所述关系包括以下一种或一种以上关系:
显性关系、隐性关系;
其中,所述显性关系包括通过数据之间的直接关联构建获得的关系;所述隐性关系包括基于数据之间的时间、空间、语义和/或特征数据的关联,通过预设的关系匹配规则或机器学习方式获得的关系。
6.根据权利要求5所述的方法,其特征在于,
所述关系包括所述显性关系时,所述显性关系包括以下一种或一种以上关系:父子关系、夫妻关系、同学关系、财产所属关系;
所述关系包括所述隐性关系时,所述隐性关系包括以下一种或一种以上关系:同行关系、同住关系、伴随关系、同案关系。
7.根据权利要求1、2、5或6所述的方法,其特征在于,所述建立数据模型之前,所述方法还包括:
基于流式消息队列获取所述事件;
其中,所述事件包括以下一种或一种以上内容:火车出行事件、车辆卡口事件、网吧事件、住宿事件。
8.根据权利要求7所述的方法,其特征在于,所述基于流式消息队列获取所述事件包括:
基于流式消息队列,从所述实体的行为数据中获取所述事件;
其中,所述行为数据包括以下一种或一种以上数据:主体、客体、时间、地点、时间段及事件内容;所述事件包括以下一种或一种以上信息:主体、客体、时间维度信息、地理维度信息。
9.根据权利1、2、5或6所述的方法,其特征在于,所述通过构建的知识图谱进行数据检索包括:
接收进行数据检索的检索信息;
根据接收到的检索信息对构建的所述知识图谱进行数据的检索处理;
其中,所述检索信息包括包含以下一种或一种以上内容的信息:所述实体的属性、所述关系的种类、和/或所述事件的内容。
10.一种数据处理的装置,其特征在于,包括:建模单元、图谱单元和检索单元;其中,
建模单元用于:根据包括实体、关系和事件的数据信息,建立数据模型;
图谱单元用于:根据建立的数据模型构建知识图谱;
检索单元用于:通过构建的知识图谱进行数据检索。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京明略软件系统有限公司,未经北京明略软件系统有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910113903.3/1.html,转载请声明来源钻瓜专利网。