[发明专利]语义识别方法、装置、电子设备及存储介质在审
申请号: | 201911151625.7 | 申请日: | 2019-11-21 |
公开(公告)号: | CN112825114A | 公开(公告)日: | 2021-05-21 |
发明(设计)人: | 李向阳;胡韧奋;谢志华 | 申请(专利权)人: | 中兴通讯股份有限公司 |
主分类号: | G06F40/30 | 分类号: | G06F40/30;G06F40/289;G06F16/33;G06F16/332;G06F16/35 |
代理公司: | 深圳鼎合诚知识产权代理有限公司 44281 | 代理人: | 薛祥辉 |
地址: | 518057 广东省深圳市*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 语义 识别 方法 装置 电子设备 存储 介质 | ||
1.一种语义识别方法,其特征在于,包括:
获取待识别查询文本;
通过语义联合识别模型,对所述待识别查询文件进行识别,输出意图识别结果和槽值识别结果;
所述语义联合识别模型包括:根据意图识别模型的第一模型损失和槽值标注模型的第二模型损失,对意图识别模型和槽值标注模型进行联合训练所得到的具有关联性的意图识别模型和槽值标注模型。
2.如权利要求1所述的语义识别方法,其特征在于,所述根据意图识别模型的第一模型损失和槽值标注模型的第二模型损失,对意图识别模型和槽值标注模型进行联合训练包括:
获取用于训练的查询文本;
提取所述查询文本的语言信息表征量,并利用领域知识库获取所述查询文本的领域信息表征量,所述领域知识库中包括至少一个领域对应的词条;
将所述语言信息表征量和所述领域信息表征量进行融合分别得到意图识别模型的第一输入向量ICLS和槽值标注模型的第二输入向量stoken;
根据意图识别模型的第一模型损失和槽值标注模型的第二模型损失,以及所述第一输入向量ICLS和第二输入向量stoken,对所述意图识别模型和槽值标注模型进行联合训练。
3.如权利要求2所述的语义识别方法,其特征在于,所述语言信息表征量包括所述查询文本的语境向量。
4.如权利要求3所述的语义识别方法,其特征在于,所述领域知识库包括:领域词条与类型对应关系;所述领域知识库包括的领域词条预设在分词词典中;以及
所述利用领域知识库获取所述查询文本的领域信息表征量包括:
利用所述分词词典对所述查询文本进行分词处理;
利用所述领域知识库,确定所述查询文本所包括的各领域词条对应的目标类型;并根据接收到的领域配置指令确定所述查询文本对应的目标领域;
提取所述目标领域对应的目标领域向量q,以及获取所述各查询文本各字符对应的目标类型向量ttoken。
5.如权利要求4所述的语义识别方法,其特征在于,所述查询文本的语境向量包括:所述查询文本的字符序列之开始位置的开始位置语境向量cCLS;
所述根据所述语言信息表征量和所述领域信息表征量得到意图识别模型的第一输入向量ICLS包括:
将所述开始位置语境向量cCLS与所述目标领域向量q进行融合得到第一输入向量ICLS。
6.如权利要求5所述的语义识别方法,其特征在于,所述查询文本的语境向量包括:所述查询文本的各字符的字符语境向量ctoken;
所述根据所述语言信息表征量和所述领域信息表征量得到槽值标注模型的第二输入向量stoken包括:
将所述各查询文本各字符对应的目标类型向量ttoken与所述字符语境向量ctoken进行融合得到第二输入向量stoken。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中兴通讯股份有限公司,未经中兴通讯股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201911151625.7/1.html,转载请声明来源钻瓜专利网。
- 上一篇:黄花菜酱菜的制备方法
- 下一篇:一种高精度抛光机床