[发明专利]语音识别方法、装置、电子设备和计算机可读介质在审
申请号: | 202210749847.4 | 申请日: | 2022-06-29 |
公开(公告)号: | CN115171695A | 公开(公告)日: | 2022-10-11 |
发明(设计)人: | 梁伟文 | 申请(专利权)人: | 东莞爱源创科技有限公司 |
主分类号: | G10L15/26 | 分类号: | G10L15/26;G10L15/01;G10L15/06 |
代理公司: | 北京唯智勤实知识产权代理事务所(普通合伙) 11557 | 代理人: | 孙姣 |
地址: | 523429 广东省东莞*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 语音 识别 方法 装置 电子设备 计算机 可读 介质 | ||
本公开的实施例公开了语音识别方法、装置、电子设备和计算机可读介质。该方法的一具体实施方式包括:接收用户语音;对用户语音进行分帧处理;对于用户语音帧集合中的每个用户语音帧:确定用户语音帧在预设状态网络中的状态标识;确定对应状态标识的状态网络边集合;对于状态网络边集合中的每个状态网络边,更新状态网络边对应的识别路径,响应于确定状态网络边对应的语音识别结果与目标用户文本模型中的叶子节点对应的语音识别结果相同,对识别路径的路径评分信息进行调整处理;根据所更新的各个识别路径的路径评分信息,生成语音识别文本。该实施方式可以使得加入的预设文本真实影响语音识别结果,且可以较快地识别用户语音,提升了用户体验。
技术领域
本公开的实施例涉及语音识别技术领域,具体涉及语音识别方法、装置、电子设备和计算机可读介质。
背景技术
语音识别是将语音识别为文本形式的技术。目前,在进行语音识别时,通常采用的方式为:在语音识别模型的训练样本中加入预设文本。
然而,发明人发现,当采用上述方式进行语音识别时,经常会存在如下技术问题:
第一,无法预知加入的预设文本是否真实影响了语音识别结果,并且由于语音识别模型是加入预设文本后训练的,模型训练需要大量时间,用户需等待较长时间才能开始使用语音识别功能,导致用户体验较差。
第二,用户无法直观地获知语音识别结果与预先加入的预设文本的相同或相异之处,进一步导致用户体验较差。
该背景技术部分中所公开的以上信息仅用于增强对本发明构思的背景的理解,并因此,其可包含并不形成本国的本领域普通技术人员已知的现有技术的信息。
发明内容
本公开的内容部分用于以简要的形式介绍构思,这些构思将在后面的具体实施方式部分被详细描述。本公开的内容部分并不旨在标识要求保护的技术方案的关键特征或必要特征,也不旨在用于限制所要求的保护的技术方案的范围。
本公开的一些实施例提出了语音识别方法、装置、电子设备和计算机可读介质,来解决以上背景技术部分提到的技术问题中的一项或多项。
第一方面,本公开的一些实施例提供了一种语音识别方法,该方法包括:接收用户语音,其中,上述用户语音对应目标用户文本模型,上述目标用户文本模型是根据对应上述用户语音的用户的语音识别参考文本生成的;对上述用户语音进行分帧处理,得到用户语音帧集合;对于上述用户语音帧集合中的每个用户语音帧,执行以下步骤:确定上述用户语音帧在预设状态网络中的状态标识;根据上述预设状态网络,确定对应上述状态标识的状态网络边集合;对于上述状态网络边集合中的每个状态网络边,根据上述状态网络边更新上述状态网络边对应的识别路径,以及响应于确定上述状态网络边对应的语音识别结果与上述目标用户文本模型中的叶子节点对应的语音识别结果相同,对上述识别路径的路径评分信息进行调整处理,得到调整后的路径评分信息,其中,调整后的路径评分信息所表征的路径评分值是针对调整前的路径评分信息所表征的路径评分值的优化值;根据所更新的各个识别路径的路径评分信息,生成对应上述用户语音的语音识别文本。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于东莞爱源创科技有限公司,未经东莞爱源创科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202210749847.4/2.html,转载请声明来源钻瓜专利网。