[发明专利]语音文本的输出方法及装置、存储介质、电子装置在审
申请号: | 202010464302.X | 申请日: | 2020-05-27 |
公开(公告)号: | CN113744718A | 公开(公告)日: | 2021-12-03 |
发明(设计)人: | 苏腾荣;马志芳;李想;赵培 | 申请(专利权)人: | 海尔优家智能科技(北京)有限公司 |
主分类号: | G10L15/02 | 分类号: | G10L15/02;G10L25/51 |
代理公司: | 北京康信知识产权代理有限责任公司 11240 | 代理人: | 张丹红 |
地址: | 100086 北京市海淀区知春*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 语音 文本 输出 方法 装置 存储 介质 电子 | ||
本发明提供了一种语音文本的输出方法及装置、存储介质、电子装置,上述方法包括:对目标语音进行语音识别,得到基于音素的语音识别结果;根据预置的音素混淆矩阵对所述语音识别结果进行修正,并输出修正后的语音文本;其中,所述音素混淆矩阵用于指示正确结果的音素序列和发音混淆的N个音素序列之间每个音素的混淆概率,其中,N为正整数,即通过上述技术方案,通过生成的音素混淆矩阵对语音识别结果进行修正,进而能够得到修正后的语音文本,因此,可以解决现有技术中传统语音对话系统中语音输出结果与真实输入存在的偏差无法进行修正等问题,以减少语音错误产生的严重影响,适应各种个性化口音。
技术领域
本发明涉及通信领域,具体而言,涉及一种语音文本的输出方法及装置、存储介质、电子装置。
背景技术
相关技术中,传统语音对话系统的基本框架如图1所示,语音通过录音设备输入后,经过信号处理和语音识别后进入对话系统,得到合适的反馈内容后进行语音输出。除了语音识别过程中,除了自身的算法误差,还有背景噪声、口语发音不准确、个性化习惯性误读、自然口语发音和连读等问题,导致语音识别的输出文本会产生一些偏差。在智能语音对话系统中,语音识别和对话系统的串联关系决定了级联错误容易对系统产生影响。
现有的智能对话系统的检索技术,一般是针对文本层面进行优化,包括实体识别、语义理解、词性标注等自然语言处理技术。这些技术可以使对话系统给出一个相对合理的输出。但是由于对话系统的输入是语音识别后的文本输出,有些文本与真实输入的偏差很小,对话系统却不能对这种错误进行修正,使得后续的检索工作产生更大的偏差。
针对相关技术中,传统语音对话系统中语音输出结果与真实输入存在的偏差无法进行修正等问题,尚未提出有效的技术方案。
发明内容
本发明实施例提供了一种语音文本的输出方法及装置、存储介质、电子装置,以至少解决相关技术中,传统语音对话系统中语音输出结果与真实输入存在的偏差无法进行修正等问题。
根据本发明的一个实施例,提供了一种语音文本的输出方法,包括:对目标语音进行语音识别,得到基于音素的语音识别结果;根据预置的音素混淆矩阵对所述语音识别结果进行修正,并输出修正后的语音文本;其中,所述音素混淆矩阵用于指示正确结果的音素序列和发音混淆的N个音素序列之间每个音素的混淆概率,其中,N为正整数。
在一个示例性实施例中,根据预置的音素混淆矩阵对所述语音识别结果进行修正,并输出修正后的语音文本之前,上述方法还包括:获取已标注正确结果的音素序列,以及发音混淆的N个音素序列;将所述已标注正确结果的音素序列和所述N个音素序列对齐,以确定用于指示所述每个音素的混淆概率的音素混淆矩阵。
在一个示例性实施例中,根据预置的音素混淆矩阵对所述语音识别结果进行修正,包括:将所述语音识别结果和所述音素混淆矩阵进行运算,得到运算结果;根据运算结果对所述语音识别结果进行修正。
在一个示例性实施例中,将所述语音识别结果和所述音素混淆矩阵进行运算,得到运算结果,包括:预设算法对所述语音识别结果和音素混淆矩阵运算,得到多个混淆概率值,其中,所述多个混淆概率值用于指示所述运算结果。
在一个示例性实施例中,根据运算结果对所述语音识别结果进行修正,包括:从所述多个混淆概率值中选择混淆概率值最大所对应的正确结果的音速序列;根据所述混淆概率最大所对应的正确结果的音速序列对所述语音识别结果进行修正。
在一个示例性实施例中,上述方法还包括:获取目标对象的语料数据;根据获取到的所述语料数据确定所述语料数据对应的正确结果的音素序列,以及发音混淆的M个音素序列,其中,M为正整数;根据所述语料数据对应的正确结果的音素序列,以及发音混淆的M个音素序列确定所述目标对象的音素混淆矩阵。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于海尔优家智能科技(北京)有限公司,未经海尔优家智能科技(北京)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010464302.X/2.html,转载请声明来源钻瓜专利网。
- 上一篇:宽带吸波超材料、天线罩及天线系统
- 下一篇:标志点成型组件及标志点成型方法