[发明专利]语音文本的处理方法和装置、存储介质和处理器在审
申请号: | 202210375489.5 | 申请日: | 2022-04-11 |
公开(公告)号: | CN114936561A | 公开(公告)日: | 2022-08-23 |
发明(设计)人: | 陈粮阳;马腾岳;李国荣;陈起进;徐晓舟;任卫军 | 申请(专利权)人: | 阿里巴巴(中国)有限公司 |
主分类号: | G06F40/30 | 分类号: | G06F40/30;G06F40/237;G06F16/33;G06F16/332;G06F16/903;G06N3/04;G06N3/08;G06N20/00 |
代理公司: | 北京博浩百睿知识产权代理有限责任公司 11134 | 代理人: | 谢湘宁;李静茹 |
地址: | 311121 浙江省杭州市余杭*** | 国省代码: | 浙江;33 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 语音 文本 处理 方法 装置 存储 介质 处理器 | ||
1.一种语音文本的处理方法,其特征在于,包括:
获取待处理的语音文本信息;
获取目标算法模型,其中,所述目标算法模型由正则匹配模型、语义匹配模型和目标意图识别模型组成;
通过所述目标算法模型对所述待处理的语音文本进行处理,得到目标语音文本信息。
2.根据权利要求1所述的方法,其特征在于,通过目标算法模型对所述待处理的语音文本进行处理,得到目标语音文本信息包括:
将所述待处理的语音文本信息与所述正则匹配模型中的正则表达式进行匹配,得到第一语音文本信息;
将所述待处理的语音文本信息与所述语义匹配模型中的标准语句库进行语义匹配,得到第二语音文本信息;
通过所述目标意图识别模型对所述待处理的语音文本信息进行处理,得到第三语音文本信息;
将所述第一语音文本信息、所述第二语音文本信息和所述第二语音文本信息作为所述目标语音文本信息。
3.根据权利要求2所述的方法,其特征在于,通过所述目标意图识别模型对所述待处理的语音文本信息进行处理,得到第三语音文本信息包括:
通过所述目标意图识别模型对所述待处理的语音文本信息进行意图识别和槽位提取,得到所述待处理的语音文本信息对应的意图标签;
将符合预设要求的意图标签对应的待处理的语音文本信息作为所述第三语音文本信息。
4.根据权利要求1所述的方法,其特征在于,在通过所述目标算法模型对所述待处理的语音文本进行处理,得到目标语音文本信息之后,所述方法还包括:
对所述目标语音文本信息进行准确性核查,得到核查结果;
依据所述核查结果,对所述目标算法模型进行迭代更新处理。
5.根据权利要求1所述的方法,其特征在于,获取目标算法模型包括:
构建正则表达式,得到所述正则匹配模型;
获取所述语义匹配模型,其中,所述语义匹配模型为基于SentenceBert的多任务学习模型;
获取所述目标意图识别模型,其中,所述意图识别模型为基于JointBert的多任务学习模型;
将所述正则匹配模型,所述语义匹配模型和所述意图识别模型组建为所述目标算法模型。
6.根据权利要求5所述的方法,其特征在于,获取所述目标意图识别模型包括:
基于JointBert的多任务学习模型进行模型构建,得到第一意图识别模型;
获取训练样本,其中,所述训练样本用于训练所述第一意图识别模型;
依据所述训练样本,采用不确定性采样的方式对所述第一意图识别模型进行预设次数的训练,在预设次数训练完成后得到第二意图识别模型;
对所述第二意图识别模型进行优化,得到所述目标意图识别模型。
7.根据权利要求6所述的方法,其特征在于,对所述第二意图识别模型进行优化,得到所述目标意图识别模型包括:
获取每次训练后得到的意图识别模型,并通过第一预设算法对所述每次训练得到的意图识别模型进行集成学习,得到第三意图识别模型;
依据所述第三意图识别模型,通过第二预设算法对所述第二意图识别模型进行迁移学习,得到第四意图识别模型;
通过第三预设算法对所述第四意图识别模型进行优化,得到第五意图识别模型;
通过第四预设算法对所述第五意图识别模型的参数进行平滑处理,得到所述目标意图识别模型。
8.根据权利要求7所述的方法,其特征在于,通过第三预设算法对所述第四意图识别模型进行优化,得到第五意图识别模型包括:
获取对抗样本,并将所述对抗样本输入所述第四意图识别模型,得到第一输出结果;
将所述训练样本输入所述第四意图识别模型,得到第二输出结果;
依据所述第一输出结果和所述第二输出结果,得到最大对称相对熵;
将所述最大对称相对熵添加到所述第四意图识别模型的损失函数中,得到目标损失函数;
依据所述目标损失函数,对所述第四意图识别模型进行优化,得到所述第五意图识别模型。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于阿里巴巴(中国)有限公司,未经阿里巴巴(中国)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202210375489.5/1.html,转载请声明来源钻瓜专利网。
- 上一篇:超声弹性成像系统和方法
- 下一篇:一种电控门锁的马达保护电路