[发明专利]一种NER实体识别算法在报表查询中的应用方法及系统在审
申请号: | 202111493638.X | 申请日: | 2021-12-08 |
公开(公告)号: | CN114238370A | 公开(公告)日: | 2022-03-25 |
发明(设计)人: | 王恩典;陈浩;侯乐;钟蔚伟 | 申请(专利权)人: | 中信银行股份有限公司 |
主分类号: | G06F16/242 | 分类号: | G06F16/242;G06F16/245 |
代理公司: | 北京市兰台律师事务所 11354 | 代理人: | 操飞越;张峰 |
地址: | 100020 北京市朝阳区光*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 ner 实体 识别 算法 报表 查询 中的 应用 方法 系统 | ||
1.一种NER实体识别算法在报表查询中的应用方法,其中,所述方法包括:
获得输入语言信息;
将所述输入语言信息输入NER实体识别模型,获得关键字段;
根据所述关键字段,获得数据查询语句;
执行所述数据查询语句在数据库系统查询指标,获得数据查询结果,并将所述数据查询结果发送至前端进行展示。
2.如权利要求1所述的方法,其中,所述将所述输入语言信息输入NER实体识别模型,包括:
根据所述输入语言信息,获得文本信息;
对所述文本信息进行错误识别,获得错误词汇;
对所述错误词汇进行补充纠错,获得预处理语言信息,将所述预处理语言信息作为输入信息输入所述NER实体识别模型。
3.如权利要求2所述的方法,其中,所述将所述输入语言信息输入NER实体识别模型,获得关键字段,包括:
将所述预处理语言信息输入BERT预训练模型进行编码,获得BERT训练调优输出层;
将所述BERT训练调优输出层输入Bi-LSTM层进行编码,获得Bi-LSTM层输出;
将所述Bi-LSTM层输出输入CRF分类标注层进行实体词槽抽取,获得所述关键字段。
4.如权利要求3所述的方法,其中,所述将所述预处理语言信息输入BERT预训练模型进行编码,获得BERT训练调优输出层,包括:
标注所述预处理语言信息的数据实体类型,所述数据实体类型包括表字段、时间字段、机构字段;
基于所述表字段、时间字段、机构字段对所述BERT预训练模型进行调优,获得所述BERT训练调优输出层。
5.如权利要求1所述的方法,其中,所述根据所述关键字段,获得数据查询语句之前,包括:
对所述关键字段进行标准化处理,获得标准指标;
根据所述标准指标在数据库系统查询指标,获得指标查询结果;
当所述指标查询结果为第一结果时,将所述指标查询结果作为所述数据查询结果,并将所述数据查询结果发送至前端进行展示。
6.如权利要求5所述的方法,其中,当所述指标查询结果为第二结果时,所述根据所述关键字段,获得数据查询语句,包括:
根据规则模型生成SQL算法,获得SQL规则模型;
将所述标准指标输入所述SQL规则模型,获得第一输出结果;
当所述第一输出结果为第一结果时,根据所述第一输出结果,获得所述数据查询语句。
7.如权利要求6所述的方法,其中,当所述第一输出结果为第二结果时,所述方法包括:
将所述标准指标输入NL2SQL模型,所述NL2SQL模型为基于所述规则模型生成SQL算法补充NL2SQL算法构建的预测模型,其中,所述NL2SQL模型包括第一子任务、第二子任务;
基于所述第一子任务,获得第一预测结果;
基于所述第二子任务,获得第二预测结果;
将所述第一预测结果、所述第二预测结果进行拼接,获得第二输出结果,所述第二输出结果包括所述数据查询语句。
8.如权利要求7所述的方法,其中,当所述数据查询语句为所述第二输出结果时,所述执行所述数据查询语句在数据库系统查询指标,获得数据查询结果,包括:
根据所述数据查询结果,获得预测结果概率;
判断所述预测结果概率是否满足第一预定阈值;
当满足时,将所述数据查询结果发送至前端进行展示;
当不满足时,返回预设结果。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中信银行股份有限公司,未经中信银行股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202111493638.X/1.html,转载请声明来源钻瓜专利网。