[发明专利]语音识别方法、介质、装置和计算设备在审
申请号: | 202111258407.0 | 申请日: | 2021-10-27 |
公开(公告)号: | CN113763938A | 公开(公告)日: | 2021-12-07 |
发明(设计)人: | 张潆心;杜彬彬;李雨珂;杨卫强;朱浩齐 | 申请(专利权)人: | 杭州网易智企科技有限公司 |
主分类号: | G10L15/14 | 分类号: | G10L15/14;G10L15/16;G10L15/26 |
代理公司: | 北京同立钧成知识产权代理有限公司 11205 | 代理人: | 孙静;刘芳 |
地址: | 310052 浙江省杭州市*** | 国省代码: | 浙江;33 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 语音 识别 方法 介质 装置 计算 设备 | ||
本公开的实施方式提供了一种语音识别方法、介质、装置和计算设备。该方法包括:获取待识别语音的各特征词的语言模型概率,语言模型概率用于指示对应的特征词出现的概率;根据各特征词的语言模型概率,获取各特征词的权重激励值,权重激励值用于提高对应的特征词的召回率;根据各特征词的权重激励值对待识别语音解码,得到待识别语音对应的文本。本公开的方案,通过获取各特征词的语言模型概率,并基于语言模型概率来获取各特征词的权重激励值,无需人工配置特征词的权重,提高了语音识别的效果。
技术领域
本公开的实施方式涉及人工智能技术领域,更具体地,本公开的实施方式涉及一种语音识别方法、介质、装置和计算设备。
背景技术
本部分旨在为权利要求书中陈述的本公开的实施方式提供背景或上下文。此处的描述不因为包括在本部分中就承认是现有技术。
语音识别是对语音信号解码,将语音信号转换为对应的文本的过程。随着人工智能技术的发展,语音识别被广泛应用于会议、采访、演讲等场景中。
在语音识别的过程中,为了提高语音识别的准确率,通常会采用特征词激励机制辅助语音识别。具体的,根据语音信号相关的场景,确定相关的特征词并为各个特征词配置一定的权重。在进行语音识别的过程中,根据语音信号的解码路径中是否包括特征词来对解码路径进行相应的权重激励,从而提高特征词所在的路径的累计概率,进而提高语音识别的准确率。
目前在为语音信号配置特征词的权重时,通常是人工进行配置的,人工配置的特征词的权重往往基于主观认知,导致基于特征词权重激励辅助语音识别的效果不佳。
发明内容
本公开的实施例提供一种语音识别方法、介质、装置和计算设备,以解决由于人工配置特征词的权重基于主观认知,导致语音识别的效果不佳的问题。
在本公开实施方式的第一方面中,提供了一种语音识别方法,包括:
获取待识别语音的各特征词的语言模型概率,所述语言模型概率用于指示对应的特征词出现的概率;
根据各所述特征词的语言模型概率,获取各所述特征词的权重激励值,所述权重激励值用于提高对应的特征词的召回率;
根据各所述特征词的权重激励值对所述待识别语音解码,得到所述待识别语音对应的文本。
在本公开的一个实施例中,所述根据各所述特征词的语言模型概率,获取各所述特征词的权重激励值,包括:
根据各所述特征词的语言模型概率,获取各所述特征词的初始化权重值;
对所述初始化权重值进行更新处理,得到各所述特征词的权重激励值,所述更新处理包括阈值筛选处理和/或步长调整处理。
在本公开的一个实施例中,所述根据各所述特征词的语言模型概率,获取各所述特征词的初始化权重值,包括:
根据预设函数对各所述特征词的语言模型概率处理,得到各所述特征词的函数值;
对各所述特征词的函数值进行范围映射处理,得到各所述特征词的初始化权重值,其中,各所述特征词的初始化权重值位于第一预设范围内。
在本公开的一个实施例中,所述更新处理包括所述阈值筛选处理,所述对所述初始化权重值进行更新处理,得到各所述特征词的权重激励值,包括:
在各所述特征词中,确定所述初始化权重值处于第二预设范围内的第一特征词,以及所述初始化权重值处于所述第二预设范围外的第二特征词;
确定所述第一特征词的权重激励值为所述第一特征词的初始化权重值;
确定所述第二特征词的权重激励值为第一预设值。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于杭州网易智企科技有限公司,未经杭州网易智企科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202111258407.0/2.html,转载请声明来源钻瓜专利网。
- 上一篇:螺旋桨平衡两轮飞车
- 下一篇:公路工程施工方法及系统