[发明专利]一种语义分析识别方法、系统、介质和设备在审

申请号：	201910558050.4	申请日：	2019-06-26
公开（公告）号：	CN110413992A	公开（公告）日：	2019-11-05
发明（设计）人：	彭德光;孙健	申请（专利权）人：	重庆兆光科技股份有限公司
主分类号：	G06F17/27	分类号：	G06F17/27
代理公司：	重庆渝之知识产权代理有限公司 50249	代理人：	柴社英
地址：	400000 重庆市沙坪***	国省代码：	重庆;50
权利要求书：	查看更多	说明书：	查看更多
摘要：
搜索关键词：	特征向量语料库词义逻辑库句义语义分析文本解析自然语言识别关键信息逻辑约束语义识别预先建立融合语料创建
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【说明书】：

本发明提出一种语义分析识别方法、系统、介质和设备，包括：根据预先建立的语料库设置针对关键信息的逻辑约束，创建逻辑库；根据所述语料库和所述逻辑库，训练词义识别模型，获取语料库词义特征向量；根据所述语料库和所述逻辑库，训练句义识别模型，获取语料库句义特征向量；根据所述语料库的词义特征向量、句义特征向量和所述逻辑库，训练融合模型，获取语料特征和所述语料库文本的对应关系；获取待解析文本的词义特征向量和句义特征向量；根据所述待解析文本的词义特征向量、句义特征向量和所述逻辑库，结合所述融合模型，获取语义识别结果；本发明可以有效提高自然语言识别的准确性。

技术领域

本发明涉及自然语言识别领域，尤其涉及一种语义分析识别方法、系统、介质和设备。

背景技术

自然语言处理技术主要分为语法分析和统计两大类。目前，国内外的大量自然语言研究都是集中于基于统计和基于深度学习技术的自然语言处理技术。在目前互联网存在各行业无标注语料大数据的情况下，利用深度学习技术，构建无监督学习，建立其语义模型、行业知识库显得尤为重要，也是将来的发展趋势。深度学习技术的兴起为统计类方法提供了更好的实现途径，大大提高了神经网络的学习预测能力。

然而，在某些特定的专业领域，如法律咨询等，问答语料标注数据较少，难以直接应用于需要大量样本数据的深度神经网络。另外，现有的自然语言处理方式大多都是采用关键词提取和统计的方法，这种语义理解方式比较局限，因为，除了字面上的语义外，对语义的理解还依赖于上下文和日常知识。

因此，目前亟需一种能够更有效更精确的语义理解方法。

发明内容

鉴于以上现有技术存在的问题，本发明提出一种语义分析识别方法、系统、介质和设备，主要解决自然语言的理解和识别准确率不高的问题。

为了实现上述目的及其他目的，本发明采用的技术方案如下。

一种语义分析识别方法，包括：

根据预先建立的语料库设置针对关键信息的逻辑约束，创建逻辑库；

创建词义识别模型，根据所述语料库和所述逻辑库，训练所述词义识别模型，建立词语与语料库中文本上下文的对应关系，获取语料库词义特征向量；

创建句义识别模型，根据所述语料库和所述逻辑库，训练所述句义识别模型，建立句子与语料库中文本上下文的对应关系，获取语料库句义特征向量；

创建融合模型，根据所述语料库的词义特征向量、句义特征向量和所述逻辑库，训练所述融合模型，获取语料特征和所述语料库文本的对应关系；

将待解析文本分别输入经过训练的词义识别模型和句义识别模型，获取待解析文本的词义特征向量和句义特征向量；

将所述待解析文本的词义特征向量、句义特征向量和对应的逻辑约束，输入所述融合模型，获取语义识别结果。