[发明专利]语音交互过程中的多音字播报方法及系统有效
申请号: | 201611199610.4 | 申请日: | 2016-12-22 |
公开(公告)号: | CN106710585B | 公开(公告)日: | 2019-11-08 |
发明(设计)人: | 王鸣 | 申请(专利权)人: | 云知声(上海)智能科技有限公司 |
主分类号: | G10L13/02 | 分类号: | G10L13/02;G10L13/08;G10L15/02;G10L15/06 |
代理公司: | 上海唯源专利代理有限公司 31229 | 代理人: | 曾耀先 |
地址: | 200233 上海市徐*** | 国省代码: | 上海;31 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 播报 多音字 反馈信息 音素信息 语音交互 语音信息 注音 文本信息 先验信息 音信息 准确率 存储 释放 | ||
1.一种语音交互过程中的多音字播报方法,包括步骤a.获取语音信息;其特征在于,还包括如下步骤:
b.识别所述语音信息,通过识别得出所述语音信息对应的文本信息和音素信息;
c.执行所述文本信息的指令并形成相应的反馈信息;
d.对所述反馈信息进行注音:查找所述反馈信息中是否包括多音字,若查找到多音字,将反馈信息与所述文本信息进行比对,若比对成功,从所述音素信息中获取发音并对反馈信息中的多音字进行注音;若比对不成功,则依据大量数据训练模型的方法来对反馈信息中的多音字进行注音;
e.对所述反馈信息进行播报。
2.根据权利要求1所述的语音交互过程中的多音字播报方法,其特征在于:在所述步骤b中,还包括将所述文本信息和音素信息作为先验信息进行存储。
3.根据权利要求2所述的语音交互过程中的多音字播报方法,其特征在于:所述反馈信息播报结束后,释放预先存储的先验信息。
4.根据权利要求1所述的语音交互过程中的多音字播报方法,其特征在于:在所述步骤c中,所述反馈信息是文本形式的信息。
5.根据权利要求1所述的语音交互过程中的多音字播报方法,其特征在于:在所述步骤d中,还包括对所述反馈信息中的单音字进行注音。
6.根据权利要求1所述的语音交互过程中的多音字播报方法,其特征在于:在所述步骤d中,若在所述反馈信息中未查找到多音字,则直接对反馈信息进行注音。
7.一种实施如权利要求1至6中任一项所述的语音交互过程中的多音字播报方法的系统,其特征在于,所述系统包括录音模块、语音识别模块、处理及控制模块、语音合成模块以及语音播报模块:
所述录音模块,与所述语音识别模块以及所述处理及控制模块连接,用于获取语音信息并将所述语音信息传送给所述语音识别模块;
所述语音识别模块,与所述处理及控制模块连接,用于识别所述语音信息并得出与所述语音信息对应的文本信息和音素信息,将所述文本信息和音素信息传送给所述处理及控制模块;
所述处理及控制模块,与所述语音合成模块及语音播报模块连接,用于执行所述文本信息的指令并形成相应的反馈信息,将所述反馈信息传送给所述语音合成模块;
所述语音合成模块,与所述语音播报模块连接,用于查找所述反馈信息中是否包含多音字并对所述反馈信息进行注音,并将已注音的反馈信息传送给所述语音播报模块;
所述语音播报模块,用于播报所述已注音的反馈信息。
8.根据权利要求7所述的语音交互过程中的多音字播报系统,其特征在于,所述反馈信息是文本形式的信息。
9.根据权利要求7所述的语音交互过程中的多音字播报系统,其特征在于,所述系统还包括临时存储模块,所述临时存储模块与所述处理及控制模块连接,所述语音识别模块通过所述处理及控制模块将所述文本信息和音素信息作为先验信息存储到所述临时存储模块中。
10.根据权利要求9所述的语音交互过程中的多音字播报系统,其特征在于,所述处理及控制模块将所述先验信息从所述临时存储模块中释放。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于云知声(上海)智能科技有限公司,未经云知声(上海)智能科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201611199610.4/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种全天时雾霾图像清晰化恢复方法
- 下一篇:基于人工智能的语音处理方法及装置