[发明专利]基于语音识别的文本修正方法、装置、设备及介质有效
申请号: | 202210003418.2 | 申请日: | 2022-01-05 |
公开(公告)号: | CN114023327B | 公开(公告)日: | 2022-04-15 |
发明(设计)人: | 黄石磊;程刚;陈诚;吕少岭;廖晨 | 申请(专利权)人: | 深圳市北科瑞声科技股份有限公司 |
主分类号: | G10L15/26 | 分类号: | G10L15/26 |
代理公司: | 深圳智汇远见知识产权代理有限公司 44481 | 代理人: | 郑江燕 |
地址: | 518036 广东省深圳市福田区梅林街道*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 语音 识别 文本 修正 方法 装置 设备 介质 | ||
1.一种基于语音识别的文本修正方法,其特征在于,所述方法包括:
接收待识别语音并进行语音识别,得到所述待识别语音包含的文本词汇和每个所述文本词汇对应的多个不同评分的候选词;
选取每个所述文本词汇对应的评分最高的候选词组成第一识别结果,显示所述第一识别结果;
接收用户基于所述第一识别结果发出的修正指令,根据所述修正指令确定所述第一识别结果中待修正的目标词汇;
获取所述目标词汇对应的候选词,对所获取到的每个候选词进行扩展,得到对应的修正词条,显示所述修正词条;
接收用户基于所述修正词条发出的修正语音,根据所述修正语音选择对应的修正词条,用所选择的修正词条对应的候选词替换所述目标词汇,得到第二识别结果并进行显示;
所述对所获取到的每个候选词进行扩展,得到对应的修正词条,包括:
获取每个所述候选词的评分,根据每个所述候选词的评分的大小对所有所述候选词进行排序,得到候选词序列;
逐个生成所述候选词序列中每个所述候选词对应的多种扩展词条,其中,所述扩展词条包括候选词、所述候选词的相邻词及所述扩展词条对应的语言概率值;
对每个所述候选词的多个扩展词条进行筛选,得到每个所述候选词的修正词条;
所述候选词的相邻词包括所述候选词的前缀词及所述候选词的后缀词,所述逐个生成所述候选词序列中每个所述候选词对应的多种扩展词条,包括:
在预设的语言模型包含的词语表中,查找包含所述候选词的文本组合;
在所述文本组合中,将所述候选词左侧的文本标识为所述候选词的前缀词;或
将所述候选词右侧的文本标识为所述候选词的后缀词;
计算每个所述文本组合在所述词语表中的出现频率作为语言概率值,并将所述语言概率值添加到对应的文本组合中;
选取大于预设的概率阈值的语言概率值作为目标语言概率值,将所述目标语言概率值对应的文本组合作为所述候选词的扩展词条。
2.如权利要求1所述的基于语音识别的文本修正方法,其特征在于,所述对每个所述候选词的多个扩展词条进行筛选,得到每个所述候选词的修正词条,包括:
选取所述候选词序列中第一个候选词对应的语言概率值最大的扩展词条为基准词条,并将所述基准词条作为所述第一个候选词的修正词条;
逐个从所述候选词序列中剩余的每个候选词对应的扩展词条中,选取前缀词与所述基准词条的前缀词发音不同,后缀词与所述基准词条的后缀词发音不同,且所述语言概率值相对最大的扩展词条作为剩余的每个所述候选词对应的修正词条。
3.如权利要求1所述的基于语音识别的文本修正方法,其特征在于,所述根据所述修正语音选择对应的修正词条,包括:
识别所述修正语音对应的文本词汇;
逐个将所述修正语音对应的文本词汇与每个所述修正词条做一致性比较;
将与所述修正语音对应的文本词汇一致的修正词条作为所述修正语音对应的修正词条。
4.如权利要求1所述的基于语音识别的文本修正方法,其特征在于,所述接收待识别语音并进行语音识别,得到所述待识别语音包含的文本词汇,包括:
接收所述待识别语音;
对所述待识别语音进行分帧加窗,得到多个语音帧;
逐个提取每个所述语音帧的语音特征;
利用预设的语音识别器,根据每个所述语音帧的语音特征,生成所述待识别语音中每个文本词汇对应的多个评分不同的候选词。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于深圳市北科瑞声科技股份有限公司,未经深圳市北科瑞声科技股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202210003418.2/1.html,转载请声明来源钻瓜专利网。