[发明专利]一种语音处理方法及装置有效
申请号: | 202110668719.2 | 申请日: | 2021-06-16 |
公开(公告)号: | CN113327591B | 公开(公告)日: | 2023-01-17 |
发明(设计)人: | 彭龙腾 | 申请(专利权)人: | 北京有竹居网络技术有限公司 |
主分类号: | G10L15/04 | 分类号: | G10L15/04;G10L15/06;G10L15/18;G10L15/26;G10L15/30;H04L9/32;H04L9/40 |
代理公司: | 北京中知法苑知识产权代理有限公司 11226 | 代理人: | 李明 |
地址: | 101299 北京市平*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 语音 处理 方法 装置 | ||
本公开提供了一种语音处理方法及装置,其中,该方法首先获取目标用户的语音片段,并确定所述语音片段对应的语义识别结果;然后,展示所述语义识别结果,并获取所述目标用户针对所述语义识别结果的确认结果;最后,基于所述语义识别结果及所述目标用户针对所述语义识别结果的确认结果,确定所述语音片段对应的语义真值。本公开实施例通过向用户展示语音片段的语义识别结果,并基于用户反馈的语义识别结果的确认结果,确定语音片段的语义真值,从而简化语义真值确定的步骤,实现语义真值确定的自动化。
技术领域
本公开涉及计算机技术领域,具体而言,涉及一种语音处理方法及装置。
背景技术
随着科技的快速进步,语音识别得到了广泛的应用。通常,可以利用训练好的语音识别模型对用户输入的语音片段进行语义分析,从而执行语义对应的功能。训练语音识别模型需要大量的训练样本,训练样本包括语音片段和语音片段对应的语义真值,通常,训练样本中的语义真值通常需要工作人员逐个人工确认,耗时费力。
发明内容
本公开实施例至少提供一种语音处理方法及装置。
第一方面,本公开实施例提供了一种语音识别方法,包括:
获取目标用户的语音片段,并确定所述语音片段对应的语义识别结果;
展示所述语义识别结果,并获取所述目标用户针对所述语义识别结果的确认结果;
基于所述语义识别结果及所述目标用户针对所述语义识别结果的确认结果,确定所述语音片段对应的语义真值。
一种可选的实施方式中,所述方法还包括:
基于所述目标用户的标识信息及所述语义真值,确定是否存在利用所述语音片段训练目标语音识别模型的需求;
在存在所述需求的情况下,基于所述语音片段及所述语义真值,生成所述语音片段对应的模型训练样本;所述模型训练样本用于训练所述目标语音识别模型。
一种可选的实施方式中,所述基于所述目标用户的标识信息及所述语义真值,确定是否存在利用所述语音片段训练目标语音识别模型的需求,包括:
将所述标识信息与所述语义真值拼接,得到标识字符串;
确定所述标识字符串的签名信息,并从需求数据库中查找所述签名信息;
在所述需求数据库中不存在所述签名信息的情况下,确定存在利用所述语音片段训练目标语音识别模型的需求,并将所述签名信息存储至所述需求数据库中。
一种可选的实施方式中,所述将所述签名信息存储至所述需求数据库中,包括:
将所述签名信息存储至所述需求数据库中,并为存储的签名信息设置过期时间;
所述方法还包括:
在经过所述签名信息对应的过期时间时,将所述签名信息从所述需求数据库中删除。
一种可选的实施方式中,所述基于所述语音片段及所述语义真值,生成所述语音片段对应的模型训练样本,包括:
基于所述标识信息,对所述语音片段及所述语义真值进行签名处理;
按照预设的替换规则,将签名后的所述语义真值中的待替换数据替换为目标数据;
基于预设的加密规则,对签名后的所述语音片段进行加密处理;
将加密后的语音片段及替换后的语义真值作为所述模型训练样本。
一种可选的实施方式中,生成所述语音片段对应的模型训练样本之后,所述方法还包括:
将所述模型训练样本存储至预设的训练样本消费队列中;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京有竹居网络技术有限公司,未经北京有竹居网络技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110668719.2/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种红黏土压实度快速检测方法
- 下一篇:一种用于外敷的半夏膏及其制备方法