[发明专利]一种终端语音播报方法、装置及终端语音操作方法有效
申请号: | 201510548770.4 | 申请日: | 2015-08-31 |
公开(公告)号: | CN105206260A | 公开(公告)日: | 2015-12-30 |
发明(设计)人: | 秦永利 | 申请(专利权)人: | 努比亚技术有限公司 |
主分类号: | G10L15/00 | 分类号: | G10L15/00;G10L15/26;H04M1/725 |
代理公司: | 深圳市世纪恒程知识产权代理事务所 44287 | 代理人: | 胡海国 |
地址: | 518057 广东省深圳市南山区高新区北环大道9018*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 终端 语音 播报 方法 装置 操作方法 | ||
技术领域
本发明涉及语音识别技术领域,更具体地说,涉及一种终端语音播报方法、装置及终端语音操作方法。
背景技术
传统的语音识别系统,通过按键、关键字等方式唤醒,然后录制一段声音,将录制的音频文件传给云端或者本地语音识别引擎,对其进行识别解读,最后终端播报语音识别结果并执行相应操作,以达到一种语音操控终端的目的。然而由于使用者口头错误或者语音识别系统识别率等限制,难免出现最终识别结果不符合使用者的意图,这种情况下,终端使用者虽然知道语音识别错误,但无法终止其继续播放,进而可能导致错误的命令被执行。例如,“给李洋打电话”被识别成了“给林洋打电话”,若通信录中有“林洋”,则可能直接拨打“林洋”的电话。若在语音播放的过程中,终端使用者发现播报错误,且能随时打断播报,这样可以避免错误的命令被执行。例如,当听到播报“林洋”时,终端使用者意识到识别错误后,能及时打断且再次说“给李洋打电话”或者“李洋”,开始重新识别。
发明内容
本发明要解决的技术问题在于,针对现有技术的上述缺陷,提供一种终端语音播报方法、装置及终端语音操作方法,可以纠正正在播报的语音信息。
一种终端语音播报方法,步骤包括:
终端通过麦克风接收第一语音信号;
进行语音识别,得出第一语音识别结果,播报所述第一语音识别结果;
在语音播报过程中,检测麦克风是否接收到用户输入的纠错语音信号,若接收到所述纠错语音信号,则暂停本次语音播报;
识别纠错语音信号,得出纠错语音识别结果;
根据所述纠错语音识别结果确定所述第一语音识别结果中的错误的部分,利用所述纠错语音替换识别错误的语音,纠正后生成第二语音识别结果;
播报所述第二语音识别结果。
可选地,检测麦克风是否接收到用户的纠错语音信号,包括:
在语音播报过程中,终端保持监听模式,麦克风处于开启状态,若有语音输入,则暂停本次语音播报。
可选地,识别纠错语音,根据所述纠错语音识别结果确定所述第一语音识别结果中的错误的部分,包括:
识别纠错语音,将所述纠错语音识别结果以字符串形式保存;
将所述第一语音识别结果与所述纠错语音识别结果进行字符串顺序匹配,将匹配相似度最大的语音字符串作为识别错误的语音字符串。
可选地,确定产生识别错误的语音字符串,包括:
根据产生识别错误的语音字符串的第一个字符,确定所述产生识别错误的语音字符串的起始位置在所述语音识别结果中所对应的起始字符;
根据产生识别错误的语音字符串的最后一个字符,确定所述产生识别错误的语音字符串的结束位置在所述语音识别结果中所对应的结束字符;
根据所述起始字符和结束字符,确定出在所述语音识别结果中的字符串,作为产生识别错误的语音字符串。
可选地,利用所述纠错语音字符串替换识别错误的语音字符串,包括:
当所述产生识别错误的语音字符串的数目等于1时,直接利用所述纠错语音字符串替换所述产生识别错误的语音字符串;
当所述产生识别错误的语音字符串的数目大于1时,根据用户输入的纠错语音字符串替换对应产生识别错误的语音字符串。
本发明还提供了一种终端语音播报装置,其特征在于,包括:
音频模块,用于对用户输入的语音信号进行识别,并生成第一语音识别结果,并进行语音播报以及语音识别纠正后的继续播报;
处理模块,用于处理语音信号与语音字符串之间的转换并保存,确定所述第一语音识别结果中产生识别错误的语音字符串,利用所述纠错语音字符串替换识别错误的语音字符串;
存储模块,用于在语音播报过程中,当终端接收到用户输入的纠错语音信号时,保存第一语音识别结果,所述第一语音识别结果为用户输入语音时所产生的第一语音信号。
可选地,所述音频模块还包括:
监听单元,用于在语音播报过程中,终端保持监听模式,麦克风处于开启状态,若有语音输入,则暂停本次语音播报并保存语音识别结果。
可选地,所述确定所述第一语音识别结果中产生识别错误的语音字符串,包括:
识别纠错语音,将所述纠错语音以字符串形式保存;
将所述第一语音识别结果与所述纠错语音进行字符串顺序匹配,将匹配相似度最大的语音字符串作为识别错误的语音字符串。
本发明还提出一种终端语音操作方法,包括步骤:
终端通过麦克风接收第一语音指令;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于努比亚技术有限公司,未经努比亚技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201510548770.4/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种用于起重机的可拆式人字架
- 下一篇:用于吊装机柜内部大质量模块的装置