[发明专利]一种基于神经语义解析的金融文本公式抽取方法及装置有效
申请号: | 202110571085.9 | 申请日: | 2021-05-25 |
公开(公告)号: | CN113254581B | 公开(公告)日: | 2022-08-19 |
发明(设计)人: | 李东方;金能征;黄佳洋;陈清财;丘宇彬;陈枫;宋自文;张亚军;朱易文;徐维黛 | 申请(专利权)人: | 深圳市图灵机器人有限公司 |
主分类号: | G06F16/33 | 分类号: | G06F16/33;G06F16/35;G06F40/295;G06F40/30;G06N3/04;G06N3/08 |
代理公司: | 深圳市君胜知识产权代理事务所(普通合伙) 44268 | 代理人: | 刘文求;朱阳波 |
地址: | 518057 广东省深圳市南*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 神经 语义 解析 金融 文本 公式 抽取 方法 装置 | ||
本发明公开了一种基于神经语义解析的金融文本公式抽取方法及装置,其中,上述基于神经语义解析的金融文本公式抽取方法包括:定义抽象语法,输入蕴含金融公式的自然语言描述文本,即待抽取文本;对上述待抽取文本进行金融实体识别,并基于融合类别向量的编码器进行特征提取,基于语法树的解码器进行解码,获取各个时间步解码器输出的构造动作;基于构造动作列表构造上述金融公式对应的抽象语法树,并对上述抽象语法树进行深度优先搜索,获得形式化金融公式。与现有技术中的方案相比,本发明方案可以从自然语言描述文本中抽取金融公式,提高公式抽取效率,并使得金融领域中公式抽取和计算过程实现自动化,节省人力成本,提高办公效率。
技术领域
本发明涉及自然语言处理技术领域,尤其涉及的是一种基于神经语义解析的金融文本公式抽取方法及装置。
背景技术
随着科学技术的迅速发展,人工智能等领域的创新和发展也越来越受到关注。人工智能是研究、开发用于模拟、延伸和扩展人智能的理论、方法、技术及应用系统的一门新技术科学。目前,人工智能技术已经在医疗、金融、教育等领域得以运用。语义解析作为人工智能的一个领域,其作用也越来越重要。语义解析是将自然语言句子映射为其语义表示。
现有技术中,在语义解析领域,大部分的工作集中在将自然语言转换为SQL、Lambda Calculus、编程语言这些语义表示。现有技术的问题在于,没有考虑到将自然语言转换为公式的需求,缺乏将自然语言描述文本转换为公式的方案,不利于进行自动化公式抽取,影响公式抽取的效率。
因此,现有技术还有待改进和发展。
发明内容
本发明的主要目的在于提供一种基于神经语义解析的金融文本公式抽取方法及装置,旨在解决现有技术中没有考虑到将自然语言转换为公式的需求,缺乏将自然语言描述文本转换为公式的方案,不利于进行公式抽取的问题,影响公式抽取的效率。
为了实现上述目的,本发明第一方面提供一种基于神经语义解析的金融文本公式抽取方法,其中,上述方法包括如下步骤:
定义抽象语法:定义金融公式的抽象语法描述,用于描述上述金融公式所对应的抽象语法;
输入待抽取文本:上述待抽取文本为蕴含上述金融公式的自然语言描述文本;
金融实体识别:对上述待抽取文本进行命名实体识别,识别出上述待抽取文本中包含的所有用于组成上述金融公式的金融实体,并标注上述金融实体在上述金融公式中的成分类别;
融合类别向量的编码器特征提取:对上述待抽取文本中的上述金融实体和其它词语构建语义表示向量,对上述金融实体分别构建表示其成分类别的类别表示向量,对所有其它词语按照同一个类别构建类别表示向量,将上述待抽取文本的词序列中每个上述金融实体及其它词语的上述语义表示向量与上述类别表示向量进行拼接后,按顺序输入到融合类别向量的编码器中,获取上述编码器输出的与上述待抽取文本对应的隐藏状态序列;
基于语法树的解码器进行解码:定义上述解码器的输出为上述金融公式对应的抽象语法树的一组构造动作,上述构造动作用于重建上述抽象语法树,在解码过程中的每一个时间步,以上述编码器的所有隐藏状态序列作为键值对,计算上述解码器当前时间步的隐藏状态对应的注意力向量,基于上述注意力向量计算所有可能的抽象语法树的构造动作的概率,将所有可能的构造动作中符合语法限制规则且对应的概率最大者作为上述当前时间步的解码器的输出;
金融公式语法树的构造:基于构造动作列表构造上述金融公式对应的抽象语法树,其中,上述构造动作列表包括上述解码器输出的所有构造动作;
形式化金融公式的生成:对上述金融公式的抽象语法树进行深度优先搜索,将每个节点和边进行拼接,获得上述形式化金融公式。
可选的,上述定义抽象语法包括如下步骤:
分析业务需求:根据实际业务场景,获取目标公式的类型;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于深圳市图灵机器人有限公司,未经深圳市图灵机器人有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110571085.9/2.html,转载请声明来源钻瓜专利网。