[发明专利]一种语义分析识别方法、系统、介质和设备在审
申请号: | 201910558050.4 | 申请日: | 2019-06-26 |
公开(公告)号: | CN110413992A | 公开(公告)日: | 2019-11-05 |
发明(设计)人: | 彭德光;孙健 | 申请(专利权)人: | 重庆兆光科技股份有限公司 |
主分类号: | G06F17/27 | 分类号: | G06F17/27 |
代理公司: | 重庆渝之知识产权代理有限公司 50249 | 代理人: | 柴社英 |
地址: | 400000 重庆市沙坪*** | 国省代码: | 重庆;50 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 特征向量 语料库 词义 逻辑库 句义 语义分析 文本 解析 自然语言识别 关键信息 逻辑约束 语义识别 预先建立 融合 语料 创建 | ||
本发明提出一种语义分析识别方法、系统、介质和设备,包括:根据预先建立的语料库设置针对关键信息的逻辑约束,创建逻辑库;根据所述语料库和所述逻辑库,训练词义识别模型,获取语料库词义特征向量;根据所述语料库和所述逻辑库,训练句义识别模型,获取语料库句义特征向量;根据所述语料库的词义特征向量、句义特征向量和所述逻辑库,训练融合模型,获取语料特征和所述语料库文本的对应关系;获取待解析文本的词义特征向量和句义特征向量;根据所述待解析文本的词义特征向量、句义特征向量和所述逻辑库,结合所述融合模型,获取语义识别结果;本发明可以有效提高自然语言识别的准确性。
技术领域
本发明涉及自然语言识别领域,尤其涉及一种语义分析识别方法、系统、介质和设备。
背景技术
自然语言处理技术主要分为语法分析和统计两大类。目前,国内外的大量自然语言研究都是集中于基于统计和基于深度学习技术的自然语言处理技术。在目前互联网存在各行业无标注语料大数据的情况下,利用深度学习技术,构建无监督学习,建立其语义模型、行业知识库显得尤为重要,也是将来的发展趋势。深度学习技术的兴起为统计类方法提供了更好的实现途径,大大提高了神经网络的学习预测能力。
然而,在某些特定的专业领域,如法律咨询等,问答语料标注数据较少,难以直接应用于需要大量样本数据的深度神经网络。另外,现有的自然语言处理方式大多都是采用关键词提取和统计的方法,这种语义理解方式比较局限,因为,除了字面上的语义外,对语义的理解还依赖于上下文和日常知识。
因此,目前亟需一种能够更有效更精确的语义理解方法。
发明内容
鉴于以上现有技术存在的问题,本发明提出一种语义分析识别方法、系统、介质和设备,主要解决自然语言的理解和识别准确率不高的问题。
为了实现上述目的及其他目的,本发明采用的技术方案如下。
一种语义分析识别方法,包括:
根据预先建立的语料库设置针对关键信息的逻辑约束,创建逻辑库;
创建词义识别模型,根据所述语料库和所述逻辑库,训练所述词义识别模型,建立词语与语料库中文本上下文的对应关系,获取语料库词义特征向量;
创建句义识别模型,根据所述语料库和所述逻辑库,训练所述句义识别模型,建立句子与语料库中文本上下文的对应关系,获取语料库句义特征向量;
创建融合模型,根据所述语料库的词义特征向量、句义特征向量和所述逻辑库,训练所述融合模型,获取语料特征和所述语料库文本的对应关系;
将待解析文本分别输入经过训练的词义识别模型和句义识别模型,获取待解析文本的词义特征向量和句义特征向量;
将所述待解析文本的词义特征向量、句义特征向量和对应的逻辑约束,输入所述融合模型,获取语义识别结果。
可选地,所述获取语料库词义特征向量包括:
对所述语料库中文本进行分词处理;
对分词处理结果进行编码,获取词编码数据;
创建神经网络,将所述词编码数据和对应的逻辑约束输入所述神经网络,对所述神经网络进行训练,获取词义识别模型;
根据所述词义识别模型的识别结果,将关联词语整合后转换成语料库词义特征向量。
可选地,所述获取语料库句义特征向量包括:
对所述语料库中文本进行分句处理;
对分句处理结果进行编码,获取句编码数据;
创建镜像深度神经网络,将所述句编码数据和对应的逻辑约束输入所述镜像深度神经网络,对所述镜像深度神经网络进行训练,获取句义识别模型;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于重庆兆光科技股份有限公司,未经重庆兆光科技股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910558050.4/2.html,转载请声明来源钻瓜专利网。