[发明专利]一种基于句子结构深层解析的多意图识别方法及系统有效
申请号: | 201910808700.6 | 申请日: | 2019-08-29 |
公开(公告)号: | CN110532558B | 公开(公告)日: | 2023-07-18 |
发明(设计)人: | 牛迪;王涛;周彬 | 申请(专利权)人: | 杭州涂鸦信息技术有限公司 |
主分类号: | G06F40/30 | 分类号: | G06F40/30;G06F40/289;G06F40/211 |
代理公司: | 北京崇智知识产权代理有限公司 11605 | 代理人: | 程旭辉 |
地址: | 310012 浙江省杭*** | 国省代码: | 浙江;33 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 句子 结构 深层 解析 意图 识别 方法 系统 | ||
本发明涉及一种多意图识别方法及系统,其中,多意图识别方法,包括以下步骤:获取用户的语言信息;对语言信息进行预处理;根据语言修正信息中每个词构建对应词的特征向量;根据长短时记忆模型对每个词的字符向量进行编码;根据编码字符向量、词向量、词性向量、NER向量和本体向量经Bi‑LSTM编码;根据深度神经网络对隐向量进行编码;根据父子关系矩阵和句法关系矩阵识别目标词的父词和父词与目标前词的句法关系;根据预设配价知识库对父词和句法关系进行语义解析;根据语义关系进行意图分类。在本发明的技术方案中,其能够根据句子结构对单个句子进行深层解析,解析出单个句子中包含的多意图信息。
技术领域
本发明涉及语言识别领域,尤其涉及一种基于句子结构深层解析的多意图识别方法和一种基于句子结构深层解析的多意图识别系统。
背景技术
意图识别是指在人机交互的过程中,机器对于用户的自然语言进行理解,识别出用户的具体意图。例如在智能家居的人机对话系统中,用户对聊天机器人说“帮我打开灯”,那么用户的意图就是“打开灯”的设备操作。意图识别在人工智能领域的人机对话系统和信息检索领域都有广泛的应用。
当前,意图识别的算法主要是针对单个意图的分类或者匹配,所谓单意图是指句子中只有一个意图,如“帮我打开灯”只有“打开灯”的意图。但是在实际应用中,用户会在句子中表达多个意图,比如“打开灯关闭空调”就包含了“打开灯”和“关闭空调”两个意图。在处理这类多意图的句子时,目前的分类算法和匹配算法都会遇到相应的困难。因为分类算法和匹配算法都归属于1-best的类型,即从多选项中选择出一个最好的类别。这种处理方式天然地与多意图相对立。
为了支持多意图,当前的分类算法和匹配算法多采用拆分句子的方案。但当前拆分句子的方案还只是局限于句子的表层信息,如根据句子中的标点符号来做拆分,或根据句子中的动词来做拆分。但是这些处理方案都能很容易的找到反面案例,比如句子中可能并不存在标点符号,又比如句子中的单个的动词并不能表达出用户的意图。因此上述的处理方案并不能从根本上将一个多意图的句子拆分成多个单意图的句子。
发明内容
本发明旨在至少解决现有技术或相关技术中存在的技术问题之一。
为此,本发明的一个目的在于提供一种基于句子结构深层解析的多意图识别方法,其能够根据句子结构对单个句子进行深层解析,解析出单个句子中包含的多意图信息。
本发明的另一个目的在于提供一种基于句子结构深层解析的多意图识别系统,其能够根据单个句子的结构解析出该句子中所包含的所有语义关系,然后将这些语义关系映射成意图。
为实现上述目的,本发明第一方面的技术方案提供了一种基于句子结构深层解析的多意图识别方法,包括以下步骤:获取用户的语言信息;对语言信息进行预处理,得到语言修正信息;根据语言修正信息中每个词构建对应词的特征向量,特征向量包括字符向量、词向量、词性向量、NER向量和本体向量;根据长短时记忆模型对每个词的字符向量进行编码,得到编码字符向量;根据编码字符向量、词向量、词性向量、NER向量和本体向量经Bi-LSTM编码,得到隐向量;根据深度神经网络对隐向量进行编码,得到语言修正信息中词与词之间的父子关系矩阵和句法关系矩阵;根据父子关系矩阵和句法关系矩阵识别目标词的父词和父词与目标词的句法关系;根据预设配价知识库对父词和句法关系进行语义解析,得到语义关系;根据语义关系进行意图分类,并得到对应于语言信息的多意图集合。
在该技术方案中,本方法通过对句子结构进行深层解析,分析出句子中词语间的语义关系。对这些语义关系做意图分类,汇总得出句子的多意图;在LSTM网络的Embedding层(词嵌入层)融入了词的字符特征、词特征、词性特征、NER(Named Entity Recognition,名实体)特征,以及词的本体特征,同时采用RNN对词的多字符编码,能够使对单个语句的意图识别更加准确。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于杭州涂鸦信息技术有限公司,未经杭州涂鸦信息技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910808700.6/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种无监督的文本相似度计算方法
- 下一篇:规则的处理方法及装置