[发明专利]一种基于开源信息的数据分析处理方法及装置在审
申请号: | 202010753835.X | 申请日: | 2020-07-30 |
公开(公告)号: | CN111897947A | 公开(公告)日: | 2020-11-06 |
发明(设计)人: | 刘一舟 | 申请(专利权)人: | 杭州橙鹰数据技术有限公司 |
主分类号: | G06F16/335 | 分类号: | G06F16/335;G06F16/36;G06F16/9535;G06F40/205 |
代理公司: | 北京智信禾专利代理有限公司 11637 | 代理人: | 吴肖肖 |
地址: | 310000 浙江省杭州市余杭*** | 国省代码: | 浙江;33 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 信息 数据 分析 处理 方法 装置 | ||
本申请提供一种基于开源信息的数据分析处理方法及装置,其中,所述方法包括:获取用户提供的关键词并在预设的知识图谱中对所述关键词进行遍历,获取所述关键词对应的知识扩展信息;根据所述知识扩展信息从开源信息数据中获取与所述关键词对应的知识领域信息,并根据所述知识扩展信息配置与所述知识领域信息对应的知识规则;根据所述知识规则从所述知识领域信息中获取所述关键词对应的数据分析结果。
技术领域
本说明书涉及网络信息技术领域,特别涉及一种基于开源信息的数据分析处理方法及装置、计算设备及计算机可读存储介质。
背景技术
随着互联网技术的飞速发展,网络信息的数据量呈爆炸式的增长,许多机构或者企业在处理开源信息上都存在以下痛点:信息监测效果有限,即传统的舆情监测平台在面对大量开源数据时虚警率高且处理手段偏宏观,使得其舆情监测效果有限;数据分析耗费人力,即在处理网络开源信息时人工查询及分析的工作量巨大,导致人工审核精力不足且缺少可用工具平台;缺少对风险研究判断的支持,由于发布者的意图和信息走向复杂,导致事件链路、背景知识和实时数据之间缺少自动关联从而难以准确研究判断;信息沉淀有待提升,即缺少对历史信息进行统一关联和管理的手段,使得数据、模式和经验沉淀不足。
在处理开源信息上,目前市场上仍然以传统的舆情产品为主,传统的舆情产品仍沿用旧有热点舆情追踪模式,即根据关键词规则锁定信息,分析整体舆情态势,然而该种模式未触及文本或图像内容的实体层面,无法对信息进行深度挖掘和分析。
发明内容
有鉴于此,本说明书实施例提供了一种基于开源信息的数据分析处理方法及装置、计算设备及计算机可读存储介质,以解决现有技术中存在的技术缺陷。
根据本说明书实施例的第一方面,提供了一种基于开源信息的数据分析处理方法,包括:
获取用户提供的关键词并在预设的知识图谱中对所述关键词进行遍历,获取所述关键词对应的知识扩展信息;
根据所述知识扩展信息从开源信息数据中获取与所述关键词对应的知识领域信息,并根据所述知识扩展信息配置与所述知识领域信息对应的知识规则;
根据所述知识规则从所述知识领域信息中获取所述关键词对应的数据分析结果。
根据本说明书实施例的第二方面,提供了一种基于开源信息的数据分析处理装置,包括:
信息扩展模块,被配置为获取用户输入的关键词,基于预设的知识图谱对所述关键词进行扩展,得到与所述关键词对应的知识扩展信息;
规则构建模块,被配置为根据所述知识扩展信息从开源信息数据中获取与所述关键词对应的知识领域信息,并根据所述知识扩展信息配置与所述知识领域信息对应的知识规则;
分析处理模块,被配置为根据所述知识规则从所述知识领域信息中获取所述关键词对应的数据分析处理结果。
根据本说明书实施例的第三方面,提供了一种计算设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机指令,所述处理器执行所述指令时实现所述基于开源信息的数据分析处理方法的步骤。
根据本说明书实施例的第四方面,提供了一种计算机可读存储介质,其存储有计算机指令,该指令被处理器执行时实现所述基于开源信息的数据分析处理方法的步骤。
本申请通过构建知识图谱对用户输入的关键词进行挖掘和推理,获取与关键词存在关系的知识扩展信息,从而使得本申请的方法能够在感知用户需求的基础上进行智能化认知,洞察开源大数据背后的实体关系,从而对用户输入的关键词进行扩展,准确得获知用户的业务需求。
此外,本申请能够基于所述知识图谱从开源信息数据中获取与用户的业务需求对应的知识领域信息进行分析和处理,通过关键词进行扩展丰富知识规则的语义信息,从而通过配置不同的知识规则获取贴近用户的业务需求的数据分析处理结果。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于杭州橙鹰数据技术有限公司,未经杭州橙鹰数据技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010753835.X/2.html,转载请声明来源钻瓜专利网。
- 信息记录介质、信息记录方法、信息记录设备、信息再现方法和信息再现设备
- 信息记录装置、信息记录方法、信息记录介质、信息复制装置和信息复制方法
- 信息记录装置、信息再现装置、信息记录方法、信息再现方法、信息记录程序、信息再现程序、以及信息记录介质
- 信息记录装置、信息再现装置、信息记录方法、信息再现方法、信息记录程序、信息再现程序、以及信息记录介质
- 信息记录设备、信息重放设备、信息记录方法、信息重放方法、以及信息记录介质
- 信息存储介质、信息记录方法、信息重放方法、信息记录设备、以及信息重放设备
- 信息存储介质、信息记录方法、信息回放方法、信息记录设备和信息回放设备
- 信息记录介质、信息记录方法、信息记录装置、信息再现方法和信息再现装置
- 信息终端,信息终端的信息呈现方法和信息呈现程序
- 信息创建、信息发送方法及信息创建、信息发送装置
- 数据显示系统、数据中继设备、数据中继方法、数据系统、接收设备和数据读取方法
- 数据记录方法、数据记录装置、数据记录媒体、数据重播方法和数据重播装置
- 数据发送方法、数据发送系统、数据发送装置以及数据结构
- 数据显示系统、数据中继设备、数据中继方法及数据系统
- 数据嵌入装置、数据嵌入方法、数据提取装置及数据提取方法
- 数据管理装置、数据编辑装置、数据阅览装置、数据管理方法、数据编辑方法以及数据阅览方法
- 数据发送和数据接收设备、数据发送和数据接收方法
- 数据发送装置、数据接收装置、数据收发系统、数据发送方法、数据接收方法和数据收发方法
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置