[发明专利]知识数据的抽取方法、系统、计算机设备和存储介质有效
申请号: | 201811092435.8 | 申请日: | 2018-09-19 |
公开(公告)号: | CN109189848B | 公开(公告)日: | 2023-05-30 |
发明(设计)人: | 陈泽晖;胡逸凡;李琦;黄鸿顺 | 申请(专利权)人: | 平安科技(深圳)有限公司 |
主分类号: | G06F16/25 | 分类号: | G06F16/25;G06F16/2458;G06F16/28 |
代理公司: | 北京市京大律师事务所 11321 | 代理人: | 苏福念 |
地址: | 518033 广东省深圳市福田区福*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 知识 数据 抽取 方法 系统 计算机 设备 存储 介质 | ||
本发明涉及金融信息处理技术领域,尤其涉及一种知识数据的抽取方法、系统、计算机设备和存储介质。一种知识数据的抽取方法,包括如下步骤:获取基金数据,生成基金知识数据表,所述基金数据存储于基金数据库中;获取基金知识抽取方案,应用深度学习模型对所述基金抽取方案进行训练得到基金知识抽取规则,所述基金知识抽取方案存储于所述基金数据库中;根据所述基金知识抽取规则对所述基金知识数据表进行基金知识特征的抽取。本发明通过深度学习模型对抽取规则进行优化使其能够从基金数据库中快速抽取数据。
技术领域
本发明涉及金融信息处理技术领域,尤其涉及一种知识数据的抽取方法、系统、计算机设备和存储介质。
背景技术
知识抽取是指将蕴含于信息源中的知识经过识别、理解、筛选、归纳等过程抽取出来,存储形成知识元库的过程。目前研究较多的是自然语言文本,已经出现了一些工具或系统,知识抽取已成为自然语言处理领域一个重要的研究分支。知识抽取的来源主要有结构化文本、半结构化文本、非结构化文本。所述结构化文本包括词典、主题词典、本体、全书等;所述半结构化文本主要是指标记文本,包括HTML标记文本和XMI;所述非结构化文本主要是指图书、论文等文献。
目前,基金知识抽取的难点在于对知识源中的数据进行处理,因为知识并不是以某种现成的形式存在于知识源中,只有对知识源中的数据经过分析、识别、理解、关联等一系列处理之后,才能发现其中有用的知识。
但是,在基金知识抽取的过程中存在着不能快速有效的从知识数据中抽取出需要的基金知识特征,并且没有一种具有普适性的抽取规则适用于不同的数据类型。
发明内容
有鉴于此,有必要针对现有知识抽取过程中存在着的不能快速有效的从知识数据中抽取出需要的基金知识特征的问题,提供一种基金知识抽取方法、系统、计算机设备和存储介质。
一种知识数据的抽取方法,包括如下步骤:
获取基金数据,生成基金知识数据表,所述基金数据存储于基金数据库中;
获取基金知识抽取方案,应用深度学习模型对所述基金抽取方案进行训练得到基金知识抽取规则,所述基金知识抽取方案存储于所述基金数据库中;
根据所述基金知识抽取规则对所述基金知识数据表进行基金知识特征的抽取。
在其中一个实施例中,所述获取基金数据,生成基金知识数据表,所述基金数据存储于基金数据库中,包括:
设定从所述基金数据库中获取所述基金数据的时间阈值;
当时间节点到达所述时间阈值时,对所述基金数据进行抽取;
将获得的所述基金数据进行汇总,并按照表名、表中的字段和表的记录进行划分,得到所述基金知识数据表。
在其中一个实施例中,所述获取基金知识抽取方案,应用深度学习模型对所述基金抽取方案进行训练得到基金知识抽取规则,所述基金知识抽取方案存储于所述基金数据库中,包括:
从所述基金数据库中调取所述基金知识抽取方案,所述基金知识抽取方案包括句子和关系类型,任一所述关系类型均对应有一编码向量;
将所述基金知识抽取方案传送给所述深度学习模型,通过所述深度学习模型将所述基金知识抽取方案中的句子进行矩阵化表示;
获取所述基金知识抽取方案中的关系类型所对应的编码向量,通过双向长短时记忆网络模型,对所述编码向量进行语义编码,得到句子中的每一个词的语义向量,所述编码向量it=tanh(W1+Wi+bi),式中tanh()为双曲正切函数,W1为第1个权重矩阵,Wi为第i个权重矩阵,bi为偏置项取值范围为0.05~0.10;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于平安科技(深圳)有限公司,未经平安科技(深圳)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201811092435.8/2.html,转载请声明来源钻瓜专利网。
- 数据显示系统、数据中继设备、数据中继方法、数据系统、接收设备和数据读取方法
- 数据记录方法、数据记录装置、数据记录媒体、数据重播方法和数据重播装置
- 数据发送方法、数据发送系统、数据发送装置以及数据结构
- 数据显示系统、数据中继设备、数据中继方法及数据系统
- 数据嵌入装置、数据嵌入方法、数据提取装置及数据提取方法
- 数据管理装置、数据编辑装置、数据阅览装置、数据管理方法、数据编辑方法以及数据阅览方法
- 数据发送和数据接收设备、数据发送和数据接收方法
- 数据发送装置、数据接收装置、数据收发系统、数据发送方法、数据接收方法和数据收发方法
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置