[发明专利]基于NLP的机载显控系统需求的领域模型提取方法在审
申请号: | 202010793887.X | 申请日: | 2020-08-10 |
公开(公告)号: | CN111985232A | 公开(公告)日: | 2020-11-24 |
发明(设计)人: | 王立松;于梦元 | 申请(专利权)人: | 南京航空航天大学 |
主分类号: | G06F40/289 | 分类号: | G06F40/289;G06F40/295;G06F40/30;G06F40/211;G06F40/253 |
代理公司: | 南京钟山专利代理有限公司 32252 | 代理人: | 陈月菊 |
地址: | 211016 江*** | 国省代码: | 江苏;32 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 nlp 机载 系统 需求 领域 模型 提取 方法 | ||
1.一种基于NLP的机载显控系统需求的领域模型提取方法,其特征在于,所述领域模型提取方法包括以下步骤:
S1,对输入的需求文本进行预处理;
S2,分析提取需求文本中的依赖关系以及共指解析关系;
S3,结合动词短语和名词短语组成的集合、依赖项解析的结果和共指解析的结果,将单词的依赖关系提升至语义单元依赖,触发规则构建领域模型;
S4,可视化步骤S3中构建的领域模型。
2.根据权利要求1所述的基于NLP的机载显控系统需求的领域模型提取方法,其特征在于,步骤S1中,所述需求文本是指以单条带有“SHALL”声明、以英文句号结束的输入文本。
3.根据权利要求1所述的基于NLP的机载显控系统需求的领域模型提取方法,其特征在于,步骤S1中,所述对输入的需求文本进行预处理包括以下步骤:
S11,对需求所包含的和DOT脚本文件的语法产生冲突的符号进行处理;
S12,对需求中使用序号+AND/OR的方式来表示并列关系的语句进行处理。
4.根据权利要求1所述的基于NLP的机载显控系统需求的领域模型提取方法,其特征在于,步骤S2中,所述分析提取需求文本中的依赖关系以及共指解析关系的过程包括以下步骤:
提取预处理后的需求文本中的自然语言需求,对其依次进行分词、分句、词性标注、命名实体识别、分析短语结构和依赖和共指解析处理,得到源词和目标词之间的依赖关系,所述依赖关系以三元组形式标识。
5.根据权利要求4所述的基于NLP的机载显控系统需求的领域模型提取方法,其特征在于,所述依赖关系包括结构解析树和依赖类型。
6.根据权利要求4所述的基于NLP的机载显控系统需求的领域模型提取方法,其特征在于,步骤S2中,采用二次开发的GATE工作台对自然语言需求进行处理:
依次引入ANNIE English Tokeniser组件进行分词、ANNIE Sentence Spliter组件进行分句、Stanford POS Tagger组件进行词性标注、Stanford NER组件进行命名实体识别、ANNIE VP Chunker组件进行动词组块分析、Noun Phrase Chunker组件进行名词组块分析、Stanford Parser组件进行句法分析。
7.根据权利要求1所述的基于NLP的机载显控系统需求的领域模型提取方法,其特征在于,步骤S3中,所述结合动词短语和名词短语组成的集合、依赖项解析的结果和共指解析的结果,将单词的依赖关系提升至语义单元依赖的过程包括以下步骤:
S31,将需求语句S中的所有动词短语和名词短语组成集合P,需求语句S中的依存关系分析结果组成集合DWord,需求语句S中的共指解析结果组成集合R;用集合DSem表示输出需求语句S中的语义单元依赖;
S32,初始化集合DSem,将共指解析的结果集合R赋值给DSem,定义临时变量psource和ptarget用于存放可能是依赖项的源词或目标词;
S33,针对每个单词的依赖项,识别P中依赖项的源和目标所属的元素,如果源词或目标词落在P中元素的边界之外,则该单词被视为P的成员,以将动词短语链接到其状语从句修饰符,并且补偿部分短语结构解析器所犯的错误;
其中,除了形容词修饰符依赖关系外,相同名词短语组成词之间的依赖关系被忽略。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于南京航空航天大学,未经南京航空航天大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010793887.X/1.html,转载请声明来源钻瓜专利网。
- 上一篇:煤矿自燃发火束管监测系统
- 下一篇:一种高速磁悬浮飞行汽车的轨道控制系统