[发明专利]意图识别方法、系统、计算机及可读存储介质有效
申请号: | 202211040262.1 | 申请日: | 2022-08-29 |
公开(公告)号: | CN115099242B | 公开(公告)日: | 2022-11-15 |
发明(设计)人: | 罗序俊;陶俊;张琳;朱嘉欣;尧德鹏 | 申请(专利权)人: | 江西电信信息产业有限公司 |
主分类号: | G06F40/30 | 分类号: | G06F40/30;G06K9/62;G10L15/22;G06F40/126;G06F16/35 |
代理公司: | 北京清亦华知识产权代理事务所(普通合伙) 11201 | 代理人: | 何世磊 |
地址: | 330000 江西省南昌市南*** | 国省代码: | 江西;36 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 意图 识别 方法 系统 计算机 可读 存储 介质 | ||
1.一种意图识别方法,其特征在于,所述方法包括:
当接收到用户发出的语音指令时,对所述语音指令进行预处理,以拆分出所述语音指令携带的若干文字,并获取到与若干所述文字分别对应的初始字向量;
获取若干预设类别的意图分别对应的正样本以及负样本,并初始化意图向量;
对所述正样本以及所述负样本进行切字处理,并索引出所述初始字向量,以获取到所述正样本以及所述负样本中的各个文字分别对应的目标字向量;
基于所述目标字向量在所述正样本以及所述负样本中的位置,获取所述正样本以及所述负样本中的各个所述文字对应的位置向量,并将各个所述文字对应的目标字向量和位置向量合并输入至第一预设模型中,以获取到对应的高维文本语义向量;
根据所述高维文本语义向量获取到对应的文本意图向量,并将所述文本意图向量与所述意图向量相乘,以获取到所述正样本以及所述负样本分别对应的评分;
基于所述正样本以及所述负样本的评分获取到对应的意图距离向量,并将所述意图距离向量输入至预设BPR损失函数中进行训练,以获取到含有意图信息的意图向量。
2.根据权利要求1所述的意图识别方法,其特征在于:所述当接收到用户发出的语音指令时,对所述语音指令进行预处理,以拆分出所述语音指令携带的若干文字的步骤包括:
当接收到所述用户发出的语音指令时,通过ASR将所述语音指令转换成对应的文本,并对所述文本标注意图标签;
对所述文本进行切字处理,以获取到对应的若干文字。
3.根据权利要求1所述的意图识别方法,其特征在于:所述获取到与若干所述文字分别对应的初始字向量的步骤包括:
对若干所述文字逐一进行one-hot编码处理,以获取到每一所述文字分别对应的one-hot编码xk,并分别获取到每一所述文字的上下相邻文字所对应的one-hot编码yij;
将所述one-hot编码xk和所述one-hot编码yij均输入至预设Word2Vector算法模型中,以分别获取到对应的初始字向量。
4.根据权利要求1所述的意图识别方法,其特征在于:所述将各个所述文字对应的目标字向量和位置向量合并输入至第一预设模型中,以获取到对应的高维文本语义向量的步骤包括:
将各个所述文字对应的目标字向量和位置向量进行相加处理,并同时输入至预设的bert-base-chinese模型中;
在所述bert-base-chinese模型中对所述目标字向量和所述位置向量进行特征提取,以获取到对应的高维文本语义向量。
5.根据权利要求4所述的意图识别方法,其特征在于:所述将所述意图距离向量输入至预设BPR损失函数中进行训练,以获取到含有意图信息的意图向量的步骤之后,所述方法还包括:
当获取到实际正样本或者实际负样本时,将所述实际正样本或者所述实际负样本中的各个实际文字所分别对应的实际目标字向量和实际位置向量,并将所述实际目标字向量和所述实际位置向量合并输入至所述bert-base-chinese模型中,以获取到对应的实际高维文本语义向量;
将所述实际高维文本语义向量与所述含有意图信息的意图向量相乘,以获取到所述实际正样本或者所述实际负样本对应的实际评分,并判断所述实际评分的高低;
若判断到所述实际评分较高时,则判定所述实际正样本或者所述实际负样本中不包含新的意图;
若判断到所述实际评分较低时,则判定所述实际正样本或者所述实际负样本中包含新的意图。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于江西电信信息产业有限公司,未经江西电信信息产业有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202211040262.1/1.html,转载请声明来源钻瓜专利网。
- 上一篇:大功率二极管模块测试专用工装
- 下一篇:一种环境治理用河道清污设备