[发明专利]语句意图预测方法、装置、存储介质及计算机设备在审
申请号: | 202111517296.0 | 申请日: | 2021-12-13 |
公开(公告)号: | CN114186061A | 公开(公告)日: | 2022-03-15 |
发明(设计)人: | 李好;叶松;王振华 | 申请(专利权)人: | 深圳壹账通智能科技有限公司 |
主分类号: | G06F16/35 | 分类号: | G06F16/35;G06F40/289 |
代理公司: | 北京中强智尚知识产权代理有限公司 11448 | 代理人: | 贾依娇 |
地址: | 518000 广东省深圳市前海深港合作区前*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 语句 意图 预测 方法 装置 存储 介质 计算机 设备 | ||
1.一种语句意图预测方法,其特征在于,包括:
获取目标业务场景下的待预测语句;
基于与所述目标业务场景相贴合的预设词汇词库,对所述待预测语句和预设意图语料库中的多个语料分别进行分词处理,得到所述待预测语句对应的各个分词和所述多个语料分别对应的各个关键词;
基于所述各个分词和所述各个关键词,确定所述待预测语句对应的分词占有率和所述多个语料分别对应的分词命中率;
基于所述分词占有率和所述分词命中率,计算所述多个语料分别与所述待预测语句之间的相似度;
根据计算的多个相似度,确定所述待预测语句对应的意图。
2.根据权利要求1所述的方法,其特征在于,所述基于所述各个分词和所述各个关键词,确定所述待预测语句对应的分词占有率和所述多个语料分别对应的分词命中率,包括:
确定所述各个分词对应的第一数量,所述各个关键词对应的第二数量,以及确定所述各个分词和所述各个关键词中相同分词对应的第三数量;
将所述第三数量与所述第一数量相除,得到所述待预测语句对应的分词占有率;
将所述第三数量与所述第二数量相除,得到所述多个语料分别对应的分词命中率。
3.根据权利要求2所述的方法,其特征在于,在所述确定所述各个分词和所述各个关键词中相同分词对应的第三数量之后,所述方法还包括:
将所述各个分词中的所述相同分词去除,得到所述待预测语句对应的各个剩余分词;
基于预设停用词库,将所述各个剩余分词中的停用词去除,得到所述待预测语句对应的目标分词;
确定所述目标分词对应的同义分词,并将所述目标分词和与其对应的同义分词进行替换,得到替换后的待预测语句;
确定所述替换后的待预测语句对应的各个分词和所述各个关键词中相同分词对应的第四数量;
所述将所述第三数量与所述第一数量相除,得到所述待预测语句对应的分词占有率,包括:
将所述第四数量与所述第一数量相除,得到所述替换后的待预测语句对应的分词占有率;
所述将所述第三数量与所述第二数量相除,得到所述多个语料分别对应的分词命中率,包括:
将所述第四数量与所述第二数量相除,得到所述多个语料分别对应的分词命中率。
4.根据权利要求3所述的方法,其特征在于,所述确定所述目标分词对应的同义分词,包括:
将所述目标分词和预设字符字典中的词语分别输入至预设特征向量提取模型中进行语义特征向量的提取,得到所述目标分词对应的第一语义特征向量和所述词语对应的第二语义特征向量;
基于所述第一语义特征向量和所述第二语义特征向量,计算所述目标分词与所述词语之间的余弦相似度;
判断所述余弦相似度是否大于预设相似度,若大于所述预设相似度,则将所述余弦相似度对应的词语确定为所述目标分词对应的同义分词。
5.根据权利要求1所述的方法,其特征在于,所述基于所述分词占有率和所述分词命中率,计算所述多个语料分别与所述待预测语句之间的相似度,包括:
确定所述分词占有率对应的第一权重系数,以及所述分词命中率对应的第二权重系数;
基于所述第一权重系数和所述第二权重系数,将所述分词占有率与所述分词命中率相加,得到所述多个语料分别与所述待预测语句之间的相似度。
6.根据权利要求1所述的方法,其特征在于,所述根据计算的多个相似度,确定所述待预测语句对应的意图,包括:
从所述多个相似度中确定最大相似度,并将所述最大相似度对应的语料意图确定为所述待预测语句对应的意图。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于深圳壹账通智能科技有限公司,未经深圳壹账通智能科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202111517296.0/1.html,转载请声明来源钻瓜专利网。