[发明专利]一种金融标准化领域知识图谱的构建方法及装置在审
申请号: | 202211282420.4 | 申请日: | 2022-10-19 |
公开(公告)号: | CN115438195A | 公开(公告)日: | 2022-12-06 |
发明(设计)人: | 康嘉玮 | 申请(专利权)人: | 中国农业银行股份有限公司 |
主分类号: | G06F16/36 | 分类号: | G06F16/36;G06F16/35;G06F40/295;G06F40/30;G06N3/04;G06N3/08;G06Q40/00 |
代理公司: | 北京集佳知识产权代理有限公司 11227 | 代理人: | 杨傥月 |
地址: | 100005 北*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 金融 标准化 领域 知识 图谱 构建 方法 装置 | ||
本申请提供一种金融标准化领域知识图谱的构建方法及装置,基于金融标准文件获取待识别文本;所述待识别文本包括多个实体;对所述待识别文本进行命名实体识别,得到命名实体;所述命名实体包括实体和所述实体的标签;根据所述待识别文本和所述命名实体进行关系抽取,得到命名实体的关系信息,并根据所述命名实体的关系信息构建知识图谱。对金融标准文件构建知识图谱,根据知识图谱中包括的命名实体的关系信息,对一种金融标准文件进一步分析金融标准文件以后的改进,提前布局相关领域,抢占先机,通过知识图谱可以获取到仅仅通过阅读金融标准文件无法发现关联的关系信息,提高用户对金融标准文件的理解程度,以便用户正确使用金融标准文件。
技术领域
本申请涉及计算机技术领域,特别涉及一种金融标准化领域知识图谱的构建方法及装置。
背景技术
标准化领域作为科技领域的最前沿,拥有着不同国家、不同来源却隐含关系的信息,虽然信息来源多样,但其形式以文件资料为主。而各国对于标准化领域的重视也使得领域发展迅速,汇聚了大量高精尖科技,数据呈现爆炸式增长态势。这些数据蕴含着丰富的价值信息,然而,相关人员在面对这些海量的标准化数据时,却无法高效地从中获取关键知识,从而也无法依据数据指导标准化工作,尤其是在金融标准化领域。
通过调研发现,导致数据中价值信息继续沉睡的首要问题是,这些数据缺乏紧凑有效的组织结构与直观形象的可视化查询方式,没有形成相应的标准化知识体系,难以进行深层次的数据挖掘与应用,因而利用相关数据并提供一个便捷交互的知识图谱具有重要意义。
发明内容
有鉴于此,本申请的目的在于提供一种金融标准化领域知识图谱的构建方法及装置,通过知识图谱可以获取到仅仅通过阅读金融标准文件无法发现关联的关系信息,提高用户对金融标准文件的理解程度,以便用户正确使用金融标准文件。其具体方案如下:
第一方面,本申请提供了一种金融标准化领域知识图谱的构建方法,包括:
基于金融标准文件获取待识别文本;所述待识别文本包括多个实体;
对所述待识别文本进行命名实体识别,得到命名实体;所述命名实体包括实体和所述实体的标签;
根据所述待识别文本和所述命名实体进行关系抽取,得到命名实体的关系信息,并根据所述命名实体的关系信息构建知识图谱。
第二方面,本申请实施例还提供了一种金融标准化领域知识图谱的构建装置,包括:
获取单元,用于基于金融标准文件获取待识别文本;所述待识别文本包括多个实体;
识别单元,用于对所述待识别文本进行命名实体识别,得到命名实体;所述命名实体包括实体和所述实体的标签;
构建单元,用于根据所述待识别文本和所述命名实体进行关系抽取,得到命名实体的关系信息,并根据所述命名实体的关系信息构建知识图谱。
第三方面,本申请实施例还提供了一种计算机设备,所述计算机设备包括处理器以及存储器:
所述存储器用于存储程序代码,并将所述程序代码传输给所述处理器;
所述处理器用于根据所述程序代码中的指令执行所述的方法。
第四方面,本申请实施例还提供了一种计算机可读存储介质,所述计算机可读存储介质用于存储计算机程序,所述计算机程序用于执行所述的方法。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国农业银行股份有限公司,未经中国农业银行股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202211282420.4/2.html,转载请声明来源钻瓜专利网。