[发明专利]一种基于句子结构深层解析的多意图识别方法及系统有效
申请号: | 201910808700.6 | 申请日: | 2019-08-29 |
公开(公告)号: | CN110532558B | 公开(公告)日: | 2023-07-18 |
发明(设计)人: | 牛迪;王涛;周彬 | 申请(专利权)人: | 杭州涂鸦信息技术有限公司 |
主分类号: | G06F40/30 | 分类号: | G06F40/30;G06F40/289;G06F40/211 |
代理公司: | 北京崇智知识产权代理有限公司 11605 | 代理人: | 程旭辉 |
地址: | 310012 浙江省杭*** | 国省代码: | 浙江;33 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 句子 结构 深层 解析 意图 识别 方法 系统 | ||
1.一种基于句子结构深层解析的多意图识别方法,其特征在于,包括以下步骤:
获取用户的语言信息;
对所述语言信息进行预处理,得到语言修正信息;
根据所述语言修正信息中每个词构建对应所述词的特征向量,所述特征向量包括字符向量、词向量、词性向量、NER向量和本体向量;
根据长短时记忆模型对每个所述词的所述字符向量进行编码,得到编码字符向量;
根据所述编码字符向量、所述词向量、所述词性向量、所述NER向量和所述本体向量经Bi-LSTM编码,得到隐向量;
根据深度神经网络对所述隐向量进行编码,得到所述语言修正信息中词与词之间的父子关系矩阵和句法关系矩阵;
根据所述父子关系矩阵和所述句法关系矩阵识别目标词的父词和所述父词与所述目标词的句法关系;
根据预设配价知识库对所述父词和所述句法关系进行语义解析,得到语义关系;
根据语义关系进行意图分类,并得到对应于所述语言信息的多意图集合。
2.根据权利要求1所述的基于句子结构深层解析的多意图识别方法,其特征在于,根据语义关系进行意图分类,并得到对应于所述语言信息的多意图集合包括以下步骤:
根据所述深度神经网络对所述语义关系进行编码,形成语义向量;
根据深度神经网络对所述语义向量和所述特征向量拼接成一个,得到拼接向量,并对所述拼接向量进行编码;
根据归一化指数函数对编码后的所述拼接向量进行识别,得到对应于所述语义关系的意图类别;
对所述语义关系的所述意图类别进行汇总,得到所述多意图集合。
3.根据权利要求1或2所述的基于句子结构深层解析的多意图识别方法,其特征在于:所述预处理包括数字转变和错别字纠正中的至少一种。
4.根据权利要求1或2所述的基于句子结构深层解析的多意图识别方法,其特征在于:所述句法关系包括主谓关系、动宾关系、述补关系、偏正关系、后补关系、并列关系、承接关系、递进关系、选择关系、转折关系、假设关系、因果关系、条件关系、解说关系和目的关系中的至少一种。
5.根据权利要求1或2所述的基于句子结构深层解析的多意图识别方法,其特征在于:所述Bi-LSTM编码为双向LSTM编码。
6.一种基于句子结构深层解析的多意图识别系统,其特征在于,包括:
获取模块,被设置为用于获取用户的语言信息;
预处理模块,被设置为用于对所述语言信息进行预处理,得到语言修正信息;
向量构建模块,被设置为用于根据所述语言修正信息中每个词构建对应所述词的特征向量,所述特征向量包括字符向量、词向量、词性向量、NER向量和本体向量;
向量编码模块,被设置为用于根据长短时记忆模型对每个所述词的所述字符向量进行编码,得到编码字符向量;
Bi-LSTM编码模块,被设置为用于根据所述编码字符向量、所述词向量、所述词性向量、所述NER向量和所述本体向量经Bi-LSTM编码,得到隐向量;
矩阵构建模块,被设置为用于根据深度神经网络对所述隐向量进行编码,得到所述语言修正信息中词与词之间的父子关系矩阵和句法关系矩阵;
句法关系识别模块,被设置为用于根据所述父子关系矩阵和所述句法关系矩阵识别目标词的父词和所述父词与所述目标词的句法关系;
语义解析模块,被设置为用于根据预设配价知识库对所述父词和所述句法关系进行语义解析,得到语义关系;
意图分类模块,被设置为用于根据语义关系进行意图分类,并得到对应于所述语言信息的多意图集合。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于杭州涂鸦信息技术有限公司,未经杭州涂鸦信息技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910808700.6/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种无监督的文本相似度计算方法
- 下一篇:规则的处理方法及装置