[发明专利]基于机器阅读理解的故障嵌套命名实体识别方法在审
申请号: | 202310108888.X | 申请日: | 2023-02-14 |
公开(公告)号: | CN115879474A | 公开(公告)日: | 2023-03-31 |
发明(设计)人: | 邱光应;苏厚胜;陶丹 | 申请(专利权)人: | 华东交通大学 |
主分类号: | G06F40/295 | 分类号: | G06F40/295;G06N3/0442;G06N3/045;G06F40/242 |
代理公司: | 北京中济纬天专利代理有限公司 11429 | 代理人: | 黄攀 |
地址: | 330000 江西省南*** | 国省代码: | 江西;36 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 机器 阅读 理解 故障 嵌套 命名 实体 识别 方法 | ||
本发明提出一种基于机器阅读理解的故障嵌套命名实体识别方法,该方法包括:获取得到实验数据集进行预处理;将命名实体进行标注以得到标注后的文本序列;将问题序列与标注后的文本序列输入至模型中;将静态字符向量输入至BERT模型中以得到编码输出特征;将标注后的文本序列中的每个字符,结合给定词典构建得到多个词集,进而得到词库增广特征;基于BERT模型的编码输出特征与词库增广特征进行拼接以得到最终字符表示;将最终字符表示输入至BiLSTM模型中以得到字符的上下文特征然后进行跨度预测,以最终得到答案序列。本发明解决了基于序列标注的模型无法同时提取平面和嵌套实体的问题,使其更适合船舶动力故障检查命名实体识别任务。
技术领域
本发明涉及自然语言处理中的命名实体识别技术领域,特别涉及一种基于机器阅读理解的故障嵌套命名实体识别方法。
背景技术
船舶作为交通运输的重要组成部分,在经济发展和社会生活中发挥着重要作用。为了确保船舶运行途中的安全,船舶动力故障维修管理是必要的,包括船舶动力故障检查和船舶动力故障维修。目前,已有大量的船舶动力故障检测报告产生,包括船舶动力故障相关的各种信息和维修方案。然而,在这一领域进行文本信息提取的研究较少。因此,在需要获取历史故障信息或做出维修决策时,船舶管理人员不得不手动访问电子检测报告,这使得信息检索过程耗时耗力。因此,自动从船舶动力故障检测报告中提取有价值的文本信息,已经成为大数据、人工智能时代智能化管理的迫切需求。
信息提取尤其是命名实体识别(NER)任务作为知识图谱构建,以及基于知识的问答等下游智能任务的基础研究工作之一,受到了学术界和工业界的高度关注。命名实体识别(NER)通常表示定位和分类描述一个人、位置或特定组织名称的单词或短语的过程。根据要提取的实体是否包含细粒度嵌套的实体,命名实体识别(NER)可以分为扁平命名实体识别(Nested NER)或嵌套命名实体识别(Flat NER)。由于扁平化命名实体识别通常被认为是一个序列标注问题,而嵌套命名实体是一种特殊的命名实体,即在一个实体的内部还存在着一个或多个其它实体。如图1所示,在句子“医科大学教授讲课”中,存在“医科大学”机构实体和“医科大学教授”人物实体,且实体“医科大学”嵌套在实体“医科大学教授”中。
目前,通过使用机器阅读理解(MRC)架构可以同时处理平面实体和嵌套实体。近年来,来自各个工程行业的大规模文本信息不断被收集,促进了许多下游应用,例如特定领域的知识图谱和智能QA系统。然而,现有的解决方案未能充分考虑中文船舶动力故障检测文本的领域特性。基于此,有必要提出一种基于机器阅读理解的故障嵌套命名实体识别方法与系统,以解决上述技术问题。
发明内容
为此,本发明的实施例提出一种基于机器阅读理解的故障嵌套命名实体识别方法,以解决上述技术问题。
本发明提出一种基于机器阅读理解的故障嵌套命名实体识别方法,其中,应用于船舶动力故障识别,通过基于机器阅读理解的故障嵌套命名实体识别模型来实现,所述方法包括如下步骤:
步骤1、构建命名实体数据集:
步骤1.1、获取实验数据集:
从船舶动力故障检测报告中获取得到实验数据集,并对实验数据集中的数据进行预处理;
步骤1.2、标注命名实体:
将进行预处理后的实验数据集中的命名实体进行标注以得到标注后的文本序列,其中命名实体包括船舶故障现象、船舶部件、部件元素、位置及程度;
步骤1.3、文本序列输入与字符嵌套:
将问题序列以及标注后的文本序列作为输入,用于输入至构建的基于机器阅读理解的故障嵌套命名实体识别模型中,并在输入后根据所述问题序列与所述标注后的文本序列进行字符级嵌套以得到静态字符向量与输入矩阵;
步骤2、基于机器阅读理解的故障嵌套命名实体识别模型的训练:
步骤2.1、词典增强特征动态编码:
将所述静态字符向量输入至BERT模型中以得到BERT模型的编码输出特征;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于华东交通大学,未经华东交通大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202310108888.X/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种球囊导引导管
- 下一篇:一种冲击式水轮机模型试验控制系统及方法