[发明专利]语音识别结果处理方法、装置、电子设备及介质有效
申请号: | 201910887114.5 | 申请日: | 2019-09-19 |
公开(公告)号: | CN110718226B | 公开(公告)日: | 2023-05-05 |
发明(设计)人: | 陈剑超;肖龙源;李稀敏;蔡振华;刘晓葳;王静 | 申请(专利权)人: | 厦门快商通科技股份有限公司 |
主分类号: | G10L15/26 | 分类号: | G10L15/26;G10L15/01;G06F40/284;G06F40/232 |
代理公司: | 暂无信息 | 代理人: | 暂无信息 |
地址: | 361000 福建省厦门市*** | 国省代码: | 福建;35 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 语音 识别 结果 处理 方法 装置 电子设备 介质 | ||
1.一种语音识别结果处理方法,其特征在于,包括:
获取目标用户输入的针对参照词序列文本的待识别语音信息,并对所述待识别语音信息进行语音识别,得到所述待识别语音信息对应的待标记词序列文本;
将所述待标记词序列文本和所述参照词序列文本进行比对,得到比对结果,并基于所述比对结果确定所述语音识别的字错率;
将所述待标记词序列文本进行拼音转换后,得到待标记词序列文本对应的标注拼音序列;基于所述比对结果、所述参照词序列文本对应的参照拼音序列、所述标注拼音序列对所述待标记词序列文本进行标记,并将标记结果输出;
所述将所述待标记词序列文本和所述参照词序列文本进行比对得到比对结果,并基于所述比对结果确定所述语音识别的字错率,包括:对所述待标记词序列文本进行分词,得到多个待识别词单元;
将所述多个待识别词单元与所述参照词序列文本中的参照词单元进行比对,确定将所述待标记词序列文本转换为所述参照词序列文本需要更新的待识别词单元;将所述需要更新的待识别词单元记为所述比对结果;
基于所述需要更新的待识别词单元的个数以及所述参照词序列文本中的参照词单元的个数,确定所述语音识别的字错率;
所述基于所述比对结果、所述参照词序列文本对应的参照拼音序列、所述标注拼音序列对所述待标记词序列文本进行标记,包括:基于所述需要更新的待识别词单元和所述标注拼音序列确定所述需要更新的待识别词单元中每个待识别词单元对应的标注拼音;
基于所述需要更新的待识别词单元在所述参照词序列文本中对应的参照词单元以及所述参照词序列文本对应的参照拼音序列,确定所述需要更新的待识别词单元对应的参照词单元中每个参照词单元对应的参照拼音;
根据所述需要更新的待识别词单元中每个待识别词单元对应的标注拼音,以及所述需要更新的待识别词单元对应的参照词单元中每个参照词单元对应的参照拼音,确定所述需要更新的待识别词单元的错误类型;
基于所述错误类型以及所述错误类型对应的标记方式,对所述待标记词序列文本进行标记;所述方法还包括:在对所述待标记词序列文本进行标记后,将所述标记结果中的待识别词单元以及该待识别词单元对应的参照拼音和标注拼音进行对应存储;
标记方式可用深颜色字体、加粗或下划线方式对识别错误汉字进行标记,标记之后对用户进行提示,提示方式可以为将统计错误次数在终端输出窗口进行提示;通过对语音识别文本的汉字拼音标注,可以找出是哪类错误类型,同音字识别错误和近音字识别错误,同时还能对每段错误的文字进行定位,提示用户是否发音不规范;
在对待标记词序列文本进行语音标记后,可以将参照拼音和标注拼音进行对应记录存储,形成纠错文本,用以日后进一步提高语音识别率。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于厦门快商通科技股份有限公司,未经厦门快商通科技股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910887114.5/1.html,转载请声明来源钻瓜专利网。