[发明专利]语义解析方法及装置、计算机可读存储介质、电子设备有效
申请号: | 201810918429.7 | 申请日: | 2018-08-13 |
公开(公告)号: | CN109241524B | 公开(公告)日: | 2022-12-20 |
发明(设计)人: | 田乐;张程;譚翊章 | 申请(专利权)人: | 腾讯科技(深圳)有限公司 |
主分类号: | G06F40/35 | 分类号: | G06F40/35;G06F16/35;G06F16/33 |
代理公司: | 深圳市联鼎知识产权代理有限公司 44232 | 代理人: | 刘抗美 |
地址: | 518000 广东省深圳*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 语义 解析 方法 装置 计算机 可读 存储 介质 电子设备 | ||
1.一种语义解析方法,其特征在于,包括:
获取用户输入的查询语句所对应的多个意图;
获取与各所述意图对应的实体,将所述实体分别插入到与各所述意图对应的语义槽位中,以形成多个意图槽位组合;
提取各所述意图槽位组合的至少一个预设特征,并将各所述意图槽位组合的所述预设特征组合形成与所述查询语句对应的特征向量;
将所述特征向量输入至训练好的排序模型,以获取与所述查询语句相关度最高的目标意图槽位组合,将所述目标意图槽位组合作为所述查询语句的语义解析结果;
其中,所述排序模型是根据样本特征向量和样本相关度对初始模型进行训练得到的;所述样本特征向量是根据查询语句样本对应的多个意图槽位组合样本的特征组合形成的;所述样本相关度为各所述意图槽位组合样本与所述查询语句样本之间的相关度,并且所述样本相关度是根据所述意图槽位组合中的意图的正确性以及所述意图对应的语义槽位的正确率和召回率确定的。
2.根据权利要求1所述的语义解析方法,其特征在于,获取用户输入的查询语句所对应的多个意图,包括:
将所述查询语句输入至意图分类器,以获取多个分类结果及所述多个分类结果对应的准确率;
判断所述多个分类结果的准确率与一预设值的大小关系;
若判定存在准确率大于所述预设值的目标分类结果,则将所述目标分类结果作为所述意图。
3.根据权利要求1所述的语义解析方法,其特征在于,获取与各所述意图对应的实体,包括:
从所述查询语句中抽选备选实体;
根据所述备选实体之间的包含关系,对所述备选实体进行过滤,以获得与各所述意图对应的实体。
4.根据权利要求1所述的语义解析方法,其特征在于,将所述特征向量输入至训练好的排序模型,以获取与所述查询语句相关度最高的目标意图槽位组合,包括:
将所述特征向量输入至所述排序模型,以获取所述多个意图槽位组合与所述查询语句的相关度;
将所述多个意图槽位组合根据所述相关度从高到低排序;
选取相关度最高的意图槽位组合作为所述目标意图槽位组合。
5.根据权利要求1-4任一项所述的语义解析方法,其特征在于,所述根据样本特征向量和样本相关度对初始模型进行训练得到所述排序模型,包括:
获取所述初始模型;
获取所述查询语句样本和与所述查询语句样本对应的多个意图槽位组合样本;
计算所述多个意图槽位组合样本与所述查询语句样本的样本相关度;
提取所述多个意图槽位组合样本的特征,以形成所述样本特征向量;
将所述样本特征向量与所述样本相关度输入至所述初始模型,以对所述初始模型进行训练,得到所述排序模型。
6.根据权利要求5所述的语义解析方法,其特征在于,计算所述多个意图槽位组合样本与所述查询语句样本的样本相关度,包括:
对所述多个意图槽位组合样本打分,并根据所述多个意图槽位组合样本对应的打分值获取所述样本相关度。
7.根据权利要求6所述的语义解析方法,其特征在于,对所述多个意图槽位组合样本打分,包括:
获取所述多个意图槽位组合样本中意图正确的意图槽位组合样本;
根据所述意图正确的意图槽位组合样本所对应的语义槽位的F值打分。
8.根据权利要求7所述的语义解析方法,其特征在于,所述打分值为所述意图正确的意图槽位组合样本所对应的语义槽位的F1值。
9.根据权利要求8所述的语义解析方法,其特征在于,所述打分值与所述样本相关度成正比。
10.根据权利要求5所述的语义解析方法,其特征在于,将所述样本特征向量与所述样本相关度输入至所述初始模型,以对所述初始模型进行训练,得到所述排序模型,包括:
将所述样本特征向量作为输入向量,并将所述样本相关度作为输出向量,输入至所述初始模型,以对所述初始模型进行训练,得到所述排序模型。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于腾讯科技(深圳)有限公司,未经腾讯科技(深圳)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201810918429.7/1.html,转载请声明来源钻瓜专利网。
- 上一篇:变体作弊字段的识别方法、装置及设备
- 下一篇:关键词的提取方法、装置和系统