[发明专利]意图识别模型的训练以及意图识别方法、装置、电子设备、介质及系统在审
申请号: | 202210532807.4 | 申请日: | 2022-05-11 |
公开(公告)号: | CN114970465A | 公开(公告)日: | 2022-08-30 |
发明(设计)人: | 陈芮婷;孙晓迪;张格菁;白文静 | 申请(专利权)人: | 叶睿职业技能培训(上海)有限公司 |
主分类号: | G06F40/157 | 分类号: | G06F40/157;G06N3/04 |
代理公司: | 上海华诚知识产权代理有限公司 31300 | 代理人: | 徐乐乐 |
地址: | 200000 上海市浦东*** | 国省代码: | 上海;31 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 意图 识别 模型 训练 以及 方法 装置 电子设备 介质 系统 | ||
1.一种意图识别模型的训练方法,应用于电子设备,其特征在于,所述方法包括,
获取训练样本,所述训练样本为包含一个或多个意图的文本;
根据字典将所述文本进行词嵌入,以获取词向量;
使用所述词向量训练所述意图识别模型,其中,所述意图识别模型包括:
第一模型,所述第一模型以所述词向量为输入,输出数字串,所述数字串包含所述词向量相关的信息和隐藏关系;
第二模型,所述第二模型以所述数字串作为输入,输出一个或多个意图的起始位置和结束位置。
2.根据权利要求1所述的意图识别模型的训练方法,其特征在于,所述第一模型为BERT模型,所述BERT模型将所述词向量进行标记嵌入、区间段嵌入和位置嵌入处理,以输出所述字符串。
3.根据权利要求1所述的意图识别模型的训练方法,其特征在于,所述第二模型为二层神经网络模型,所述二层神经网络模型包括隐藏层和输出层,所述隐藏层确定所述数字串和所述一个或多个意图的关系,所述输出层输出所述一个或多个意图的起始位置和结束位置。
4.根据权利要求3所述的意图识别模型的训练方法,其特征在于,所述隐藏层和所述输出层均为全连接层。
5.根据权利要求1所述的意图识别模型的训练方法,其特征在于,使用损失函数对所述第一模型和第二模型进行调整,以获取训练好的意图识别模型。
6.根据权利要求1所述的意图识别模型的训练方法,其特征在于,所述方法还包括对所述训练文本进行扩充,以获得扩充样本。
7.根据权利要求6所述的意图识别模型的训练方法,其特征在于,所述训练样本包含多个意图,对所述训练文本进行扩充包括,按照所述意图的数量生成多个位置,在所述多个位置之间插入空值或废语料,在所述多个位置上放置所述多个意图中的一个意图对应的语料或者空值。
8.一种意图识别的方法,其特征在于,所述方法包括:
获取待识别的文本;
根据字典将所述待识别的文本进行词嵌入,以获取词向量;
将所述词向量输入至意图识别模型,输出意图识别结果;
其中,所述意图识别模型是根据权利要求1至7任一项所述的训练方法训练后的意图识别模型。
9.如权利要求8所述的意图识别的方法,其特征在于,所述方法还包括根据所述意图识别结果按照预设的规则对所述待识别的文本进行评价。
10.一种意图识别模型的训练装置,其特征在于,所述装置包括:
第一获取模块,用于获取训练样本,所述训练样本为包含一个或多个意图的文本;
第二获取模块,用于根据字典将所述文本进行词嵌入,以获取词向量;
训练模块,用于使用所述词向量训练所述意图识别模型,其中,所述意图识别模型包括:
第一模型,所述第一模型以所述词向量为输入,输出数字串,所述数字串包含所述词向量相关的信息和隐藏关系;
第二模型,所述第二模型以所述数字串作为输入,输出一个或多个意图的起始位置和结束位置。
11.一种意图识别装置,其特征在于,所述装置包括:
第三获取模块,用于获取待识别的文本;
第四获取模块,用于根据字典将所述待识别的文本进行词嵌入,以获取词向量;
识别模块,用于将所述词向量输入至意图识别模型,输出意图识别结果;
其中,所述意图识别模型是根据权利要求10所述的训练装置训练后的意图识别模型。
12.一种电子设备,其特征在于,所述设备包括存储有计算机可执行指令的存储器和处理器;当所述指令被所述处理器执行时,使得所述设备实施根据权利要求1至9中任一项所述的方法。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于叶睿职业技能培训(上海)有限公司,未经叶睿职业技能培训(上海)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202210532807.4/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种人造耳蜗耳挂机及植入体
- 下一篇:一种气凝胶电池隔膜及其制备方法