[发明专利]一种基于分词和命名实体识别的多层误差反馈神经网络的句子主干分析方法及系统有效
申请号: | 201810789276.0 | 申请日: | 2018-07-18 |
公开(公告)号: | CN109241520B | 公开(公告)日: | 2023-05-23 |
发明(设计)人: | 陈涛;吴明芬 | 申请(专利权)人: | 五邑大学 |
主分类号: | G06F40/295 | 分类号: | G06F40/295;G06F40/30;G06N3/0464;G06N3/049 |
代理公司: | 广州市红荔专利代理有限公司 44214 | 代理人: | 吴伟文 |
地址: | 529020 广*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 分词 命名 实体 识别 多层 误差 反馈 神经网络 句子 主干 分析 方法 系统 | ||
1.一种能够利用词、命名实体到句子的层次化信息的基于多层误差反馈神经网络的自动句子主干分析方法,其特征在于,包括以下步骤:
S1)、使用双向LSTM神经网络对输入的中文句子进行分词,并将分词误差传递给下一层神经网络;
其中,使用双向LSTM神经网络对输入的中文句子进行分词,具体如下:输入的中文句子分为训练集和测试集两类,训练集中的句子采用人工标注的方式进行分词,用空格作为词与词之间的分隔符;
测试集中的句子则是未经过分词的中文句子;
双向LSTM神经网络在训练集上训练分词模型,在测试集上测试该模型的性能;
将分词误差传递给下一层神经网络,具体如下:
双向LSTM网络对输入的句子进行分词,将分词的结果与训练集中人工标注的结果进行对比,对比结果中不同于人工标注结果的分词方案则为训练误差,神经网络将训练误差数字化和归一化后,传递给下一层神经网络,即负责命名实体识别的神经网络;
S2)、使用双向LSTM神经网络对分词后的句子进行命名实体识别,与步骤S1)相似,输入到双向LSTM网络的中文句子同样分为训练集和测试集两类;
训练集中的句子通过人工标注了命名实体,所采用的标记方法是BIO标记法,其中,B表示命名实体的开始词;I表示命名实体的中间词或结尾词;O表示命名实体之外的词,将带有上述BIO标记的人工标注好命名实体的训练集句子输入到双向LSTM网络中,对神经网络进行训练,通过调节神经网络的参数实现模型的优化;
将一个未带有BIO序列标记的只分好词的中文句子输入到训练好的神经网络中,神经网络会给该句子中的每个词自动标注一个BIO标记,从而实现命名实体的自动学习和识别;
并将识别误差传递给下一层神经网络传递;具体如下:
双向LSTM网络对输入的句子进行命名实体识别,将命名实体识别的结果与训练集中人工标注的命名实体BIO标记结果进行对比,对比结果中不同于人工标注结果的标记被认为是训练误差,神经网络将训练误差数字化和归一化后,向上传递给负责句子主干分析的神经网络;
S3)、使用双向LSTM神经网络对命名实体识别后的句子进行句子主干分析,与前面的步骤S1)和步骤S2)相似,将人工标注了句子主干成分的中文句子作为训练集,将未标注句子主干成分的句子作为测试集,输入到双向LSTM网络中,进行训练;
其中标记句子主干成分采用Y/N标记方法标记出来,Y表示是句子主干成分,N表示不是句子主干成分;
将上一层网络识别出来的命名实体作为一个长词看待,双向LSTM神经网络在上述训练集上训练句子主干分析模型,在测试集上测试该模型的性能;
并将分析误差反向传递回整个网络的输入层;具体如下:
双向LSTM网络对输入的句子进行句子主干分析,将分析结果与训练集中人工标注的句子主干标记结果进行对比,对比结果中不同于人工标注结果的标记被认为是训练误差,神经网络将训练误差数字化和归一化后,反向传递给整个网络的输入层,即负责分词的双向LSTM网络的输入层;
S4)、经过多个周期的迭代训练后,当句子主干分析的训练误差收敛或训练周期达到一定数量时,输出带有句子主干标注信息的结果序列。
2.根据权利要求1所述的一种能够利用词、命名实体到句子的层次化信息的基于多层误差反馈神经网络的自动句子主干分析方法,其特征在于:步骤S4)中,经过多个周期的迭代训练后,得到带有句子主干标注信息的结果序列,然后利用可视化方法将其呈现给用户。
3.一种能够利用词、命名实体到句子的层次化信息的基于多层误差反馈神经网络的自动句子主干分析系统,其特征在于:所述的系统用于权利要求1或2所述的分析方法,所述的系统包括:
中文分词模块,用于将中文句子文本切分成词汇序列;
命名实体识别模块:用于对分好词的中文句子进行命名实体识别,自动分析句子中的命名实体句子主干分析,并用BIO标签标记出来;
句子主干分析模块:用于对命名实体识别后的句子的进行句子主干分析,自动识别出句子中的主要成分,并用Y/N标签标记出来;
结果输出模块,用于将句子主干分析的结果以便于用户理解的方式可视化输出。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于五邑大学,未经五邑大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201810789276.0/1.html,转载请声明来源钻瓜专利网。