[发明专利]一种语义分析识别方法、系统、介质和设备在审
申请号: | 201910558050.4 | 申请日: | 2019-06-26 |
公开(公告)号: | CN110413992A | 公开(公告)日: | 2019-11-05 |
发明(设计)人: | 彭德光;孙健 | 申请(专利权)人: | 重庆兆光科技股份有限公司 |
主分类号: | G06F17/27 | 分类号: | G06F17/27 |
代理公司: | 重庆渝之知识产权代理有限公司 50249 | 代理人: | 柴社英 |
地址: | 400000 重庆市沙坪*** | 国省代码: | 重庆;50 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 特征向量 语料库 词义 逻辑库 句义 语义分析 文本 解析 自然语言识别 关键信息 逻辑约束 语义识别 预先建立 融合 语料 创建 | ||
1.一种语义分析识别方法,其特征在于,包括:
根据预先建立的语料库设置针对关键信息的逻辑约束,创建逻辑库;
创建词义识别模型,根据所述语料库和所述逻辑库,训练所述词义识别模型,建立词语与语料库中文本上下文的对应关系,获取语料库词义特征向量;
创建句义识别模型,根据所述语料库和所述逻辑库,训练所述句义识别模型,建立句子与语料库中文本上下文的对应关系,获取语料库句义特征向量;
创建融合模型,根据所述语料库的词义特征向量、句义特征向量和所述逻辑库,训练所述融合模型,获取语料特征和所述语料库文本的对应关系;
将待解析文本分别输入经过训练的词义识别模型和句义识别模型,获取待解析文本的词义特征向量和句义特征向量;
将所述待解析文本的词义特征向量、句义特征向量和对应的逻辑约束,输入所述融合模型,获取语义识别结果。
2.根据权利要求1所述的语义分析识别方法,其特征在于,所述获取语料库词义特征向量包括:
对所述语料库中文本进行分词处理;
对分词处理结果进行编码,获取词编码数据;
创建神经网络,将所述词编码数据和对应的逻辑约束输入所述神经网络,对所述神经网络进行训练,获取词义识别模型;
根据所述词义识别模型的识别结果,将关联词语整合后转换成语料库词义特征向量。
3.根据权利要求1所述的语义分析识别方法,其特征在于,所述获取语料库句义特征向量包括:
对所述语料库中文本进行分句处理;
对分句处理结果进行编码,获取句编码数据;
创建镜像深度神经网络,将所述句编码数据和对应的逻辑约束输入所述镜像深度神经网络,对所述镜像深度神经网络进行训练,获取句义识别模型;
根据所述句义识别模型的识别结果,将关联句子整合后转换成语料库句义特征向量。
4.根据权利要求1所述的语义分析识别方法,其特征在于,所述训练融合模型包括:
根据所述逻辑库、词义特征向量和句义特征向量,获取知识单元;
对所述知识单元进行编码,获取知识编码数据;
创建深度新联神经网络,将所述知识编码数据输入深度信念神经网络进行模型训练,获取融合模型。
5.根据权利要求4所述的语义分析识别方法,其特征在于,所述获取知识单元包括:
根据所述逻辑库创建词语和句子对应的约束条件;
根据所述约束条件,获取逻辑库中与所述约束条件关联的逻辑约束,创建知识图谱;
根据所述知识图谱,提取所述语料库词义特征向量和句义特征向量中的对应的词语和句子,获取知识单元。
6.根据权利要求1所述的语义分析识别方法,其特征在于,所述获取语义识别结果包括:
计算所述待解析文本词义特征向量与所述语料库词义特征向量的相似度,获取词义相似度;
计算所述待解析文本句义特征向量与所述语料库句义特征向量的相似度,获取句义相似度;
将所述词义相似度和所述句义相似度与设定的相似度阈值进行比较,获取相似度判断结果;
根据所述相似度判断结果和所述逻辑库,获取待解析文本的知识单元。
将所述待解析文本的知识单元输入所述融合模块,获取与所述待解析文本匹配度最高的语料库文本。
7.根据权利要求1所述的语义分析识别方法,其特征在于,所述获取待解析文本的词义特征向量和句义特征向量之前,对所述待解析文本进行预处理,包括:
对待解析文本进行分词和分句处理,获取处理结果;
根据所述逻辑库,对所述处理结果进行标注。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于重庆兆光科技股份有限公司,未经重庆兆光科技股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910558050.4/1.html,转载请声明来源钻瓜专利网。