[发明专利]语义识别方法、装置、终端及存储介质在审
申请号: | 202010939996.8 | 申请日: | 2020-09-09 |
公开(公告)号: | CN112102840A | 公开(公告)日: | 2020-12-18 |
发明(设计)人: | 赖添悦;潘益民;叶濛 | 申请(专利权)人: | 中移(杭州)信息技术有限公司;中国移动通信集团有限公司 |
主分类号: | G10L15/26 | 分类号: | G10L15/26;G10L15/04;G10L15/08;G06F40/30 |
代理公司: | 上海晨皓知识产权代理事务所(普通合伙) 31260 | 代理人: | 成丽杰 |
地址: | 310011 浙江省杭州*** | 国省代码: | 浙江;33 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 语义 识别 方法 装置 终端 存储 介质 | ||
1.一种语义识别方法,其特征在于,包括:
将语音信息转换成文本信息,并对所述文本信息进行分词得到多个词槽值;
根据预先构建的字典树,查找每个所述词槽值对应的词槽;
根据所述词槽,获取目标用户意图;
根据所述目标用户意图和所述多个词槽值,得到语义识别结果。
2.根据权利要求1所述的语义识别方法,其特征在于,所述根据所述词槽,获取目标用户意图,包括:
将所述词槽进行两两组合;
获取每个所述组合对应的用户意图;
根据每个所述组合对应的用户意图,获取目标用户意图。
3.根据权利要求2所述的语义识别方法,其特征在于,所述根据每个所述组合对应的用户意图,获取目标用户意图,包括:
获取每个所述组合对应的用户意图组成的集合的交集,得到目标用户意图。
4.根据权利要求2或3所述的语义识别方法,其特征在于,所述获取每个所述组合对应的用户意图,包括:
对于任一所述组合,根据预先构建的三元组,获取所有的包含所述组合中的两个所述词槽的目标三元组;
获取所有的所述目标三元组中的用户意图,得到所述组合对应的用户意图。
5.根据权利要求1所述的语义识别方法,其特征在于,在所述根据所述词槽,获取目标用户意图之后,还包括:
获取所述目标用户意图对应的词槽;
从每个所述词槽值对应的词槽中选取属于所述目标用户意图对应的词槽的目标词槽;
所述根据所述目标用户意图和所述多个词槽值,得到语义识别结果,包括:
根据所述目标用户意图和所述目标词槽对应的词槽值,得到语义识别结果。
6.根据权利要求1所述的语义识别方法,其特征在于,所述字典树通过以下方式预先构建:
建立空的字典树;
选取样本词槽值,并在所述空的字典树中确定所述样本词槽值的路径;
将所述样本词槽值加入所述路径的各子节点,以及将所述样本词槽值对应的词槽加入所述路径的叶子节点。
7.根据权利要求4所述的语义识别方法,其特征在于,所述三元组通过以下方式预先构建:
获取样本用户意图和所述样本用户意图对应的样本词槽;
将所述样本词槽进行组合,并将所述组合中的两个所述样本词槽和所述样本用户意图构建三元组。
8.一种语义识别装置,其特征在于,包括:
分词模块,用于将语音信息转换成文本信息,并对所述文本信息进行分词得到多个词槽值;
查找模块,用于根据预先存储的字典树,查找所述词槽值对应的目标词槽;
获取模块,用于根据所述词槽,获取目标用户意图;
语义识别模块,用于根据所述用户意图和所述多个词槽值,得到语义识别结果。
9.一种终端,其特征在于,包括:
至少一个处理器;以及,
与所述至少一个处理器通信连接的存储器;其中,
所述存储器存储有可被所述至少一个处理器执行的指令,所述指令被所述至少一个处理器执行,以使所述至少一个处理器能够执行如权利要求1至7中任一所述的语义识别方法。
10.一种计算机可读存储介质,存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现权利要求1至7中任一项所述的语义识别方法。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中移(杭州)信息技术有限公司;中国移动通信集团有限公司,未经中移(杭州)信息技术有限公司;中国移动通信集团有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010939996.8/1.html,转载请声明来源钻瓜专利网。