[发明专利]基于机器阅读理解的故障嵌套命名实体识别方法在审

专利信息
申请号: 202310108888.X 申请日: 2023-02-14
公开(公告)号: CN115879474A 公开(公告)日: 2023-03-31
发明(设计)人: 邱光应;苏厚胜;陶丹 申请(专利权)人: 华东交通大学
主分类号: G06F40/295 分类号: G06F40/295;G06N3/0442;G06N3/045;G06F40/242
代理公司: 北京中济纬天专利代理有限公司 11429 代理人: 黄攀
地址: 330000 江西省南*** 国省代码: 江西;36
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 基于 机器 阅读 理解 故障 嵌套 命名 实体 识别 方法
【权利要求书】:

1.一种基于机器阅读理解的故障嵌套命名实体识别方法,其特征在于,应用于船舶动力故障识别,通过基于机器阅读理解的故障嵌套命名实体识别模型来实现,所述方法包括如下步骤:

步骤1、构建命名实体数据集:

步骤1.1、获取实验数据集:

从船舶动力故障检测报告中获取得到实验数据集,并对实验数据集中的数据进行预处理;

步骤1.2、标注命名实体:

将进行预处理后的实验数据集中的命名实体进行标注以得到标注后的文本序列,其中命名实体包括船舶故障现象、船舶部件、部件元素、位置及程度;

步骤1.3、文本序列输入与字符嵌套:

将问题序列以及标注后的文本序列作为输入,用于输入至构建的基于机器阅读理解的故障嵌套命名实体识别模型中,并在输入后根据所述问题序列与所述标注后的文本序列进行字符级嵌套以得到静态字符向量与输入矩阵;

步骤2、基于机器阅读理解的故障嵌套命名实体识别模型的训练:

步骤2.1、词典增强特征动态编码:

将所述静态字符向量输入至BERT模型中以得到BERT模型的编码输出特征;

将标注后的文本序列中的每个字符,结合给定词典构建得到第一词集、第二词集、第三词集与第四词集,根据第一词集、第二词集、第三词集与第四词集计算得到词库增广特征;

基于所述BERT模型的编码输出特征与所述词库增广特征进行拼接以得到最终字符表示;

步骤2.2、跨度预测:

将所述最终字符表示输入至由前向LSTM与后向LSTM单元组成的BiLSTM模型中以得到字符的上下文特征;

根据BiLSTM模型中输出的所述字符的上下文特征进行跨度预测,以最终得到答案序列。

2.根据权利要求1所述的基于机器阅读理解的故障嵌套命名实体识别方法,其特征在于,在所述步骤1.1中,对实验数据集中的数据进行预处理的方法包括如下步骤:

对实验数据集中的数据进行清理,将中文、标点符号以及英文按照预设格式进行统一,并删除多余文本数据、多余图片以及多余表格数据;

在所述步骤1.2中,标注后的文本序列表示为:

其中,表示标注后的文本序列,/表示第n个中文船舶动力故障检测文本字符;

在所述步骤2.2中,答案序列表示为:

其中,表示答案序列,/表示预定义列表,/表示船舶故障现象,/表示船舶部件,/表示部件元素,/表示位置,/表示程度。/

3.根据权利要求2所述的基于机器阅读理解的故障嵌套命名实体识别方法,其特征在于,在所述步骤1.3中,问题序列表示为:

其中,表示问题序列,/表示问题序列的第m个文本字符;

根据所述问题序列与所述标注后的文本序列进行字符级嵌套以得到静态字符向量与输入矩阵的方法包括如下步骤:

将问题序列与标注后的文本序列/进行连接以得到新连接序列;其中,/表示新连接序列,/表示新连接序列中的第l个文本字符,l表示新连接序列的总长度,/;

在给定的字符级嵌入查找表上执行查找操作以得到静态字符向量/与输入矩阵/;

其中,查找操作的公式表示为:,输入矩阵/,/,其中,d表示字符级嵌入查找表/中的字符向量的维数,/表示对应给定词典D中匹配单词的第i个字符。

4.根据权利要求3所述的基于机器阅读理解的故障嵌套命名实体识别方法,其特征在于,在步骤2.1中,将所述静态字符向量输入至BERT模型中以得到BERT模型的编码输出特征的方法对应有如下公式:

其中,表示BERT模型的编码输出特征,/表示BERT模型的编码块。

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于华东交通大学,未经华东交通大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/202310108888.X/1.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top