[发明专利]语音识别方法、装置、电子设备和计算机可读介质在审
申请号: | 202210749847.4 | 申请日: | 2022-06-29 |
公开(公告)号: | CN115171695A | 公开(公告)日: | 2022-10-11 |
发明(设计)人: | 梁伟文 | 申请(专利权)人: | 东莞爱源创科技有限公司 |
主分类号: | G10L15/26 | 分类号: | G10L15/26;G10L15/01;G10L15/06 |
代理公司: | 北京唯智勤实知识产权代理事务所(普通合伙) 11557 | 代理人: | 孙姣 |
地址: | 523429 广东省东莞*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 语音 识别 方法 装置 电子设备 计算机 可读 介质 | ||
1.一种语音识别方法,包括:
接收用户语音,其中,所述用户语音对应目标用户文本模型,所述目标用户文本模型是根据对应所述用户语音的用户的语音识别参考文本生成的;
对所述用户语音进行分帧处理,得到用户语音帧集合;
对于所述用户语音帧集合中的每个用户语音帧,执行以下步骤:
确定所述用户语音帧在预设状态网络中的状态标识;
根据所述预设状态网络,确定对应所述状态标识的状态网络边集合;
对于所述状态网络边集合中的每个状态网络边,根据所述状态网络边更新所述状态网络边对应的识别路径,以及响应于确定所述状态网络边对应的语音识别结果与所述目标用户文本模型中的叶子节点对应的语音识别结果相同,对所述识别路径的路径评分信息进行调整处理,得到调整后的路径评分信息,其中,调整后的路径评分信息所表征的路径评分值是针对调整前的路径评分信息所表征的路径评分值的优化值;
根据所更新的各个识别路径的路径评分信息,生成对应所述用户语音的语音识别文本。
2.根据权利要求1所述的方法,其中,所述对所述识别路径的路径评分信息进行调整处理,包括:
将所述识别路径的路径评分信息包括的路径评分值调整为目标优化路径评分值。
3.根据权利要求1所述的方法,其中,所述对所述识别路径的路径评分信息进行调整处理,包括:
响应于确定所述叶子节点对应的语音识别结果的文本类别为非敏感类,将所述识别路径的路径评分信息包括的路径评分值调整为目标优化路径评分值;
响应于确定所述叶子节点对应的语音识别结果的文本类别为敏感类,将所述识别路径的路径评分信息包括的路径评分值调整为目标弱化路径评分值。
4.根据权利要求3所述的方法,其中,所述根据所更新的各个识别路径的路径评分信息,生成对应所述用户语音的语音识别文本,包括:
响应于确定所更新的各个识别路径的路径评分信息中存在满足预设优化值条件的路径评分信息,将满足所述预设优化值条件的路径评分信息确定目标路径评分信息,其中,所述预设优化值条件为路径评分信息包括的路径评分值满足预设最值条件;
将所述目标路径评分信息对应的识别路径所表征的语音识别结果确定为对应所述用户语音的语音识别文本。
5.根据权利要求4所述的方法,其中,所述方法还包括:
响应于确定所述各个识别路径的路径评分信息包括的各个路径评分值均为非优化值类,将1确定为用户文本模型失效值;
对于所接收的在所述用户语音后的每个持续用户语音,执行以下步骤:
响应于确定针对所述持续用户语音的所更新的各个识别路径的路径评分信息包括的各个路径评分值均为非优化值类,将用户文本模型失效值加1以更新用户文本模型失效值;
确定用户文本模型失效值是否大于等于预设失效阈值;
响应于确定用户文本模型失效值大于等于所述预设失效阈值,生成用户文本模型失效提示信息;
在相关联的显示设备上显示所述用户文本模型失效提示信息;
控制相关联的声音播放设备播放用户文本模型失效提示音。
6.根据权利要求5所述的方法,其中,所述方法还包括:
响应于接收到用户上传的语音识别参考文本,根据所述语音识别参考文本,生成用户文本模型作为目标用户文本模型。
7.根据权利要求1-6之一所述的方法,其中,所述方法还包括:
在相关联的显示设备上对所述语音识别文本进行显示;
响应于检测到作用于所述语音识别文本的存储操作,根据所确定的文件存储格式,将所述语音识别文本存储为语音识别文本文件。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于东莞爱源创科技有限公司,未经东莞爱源创科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202210749847.4/1.html,转载请声明来源钻瓜专利网。