[发明专利]多音字标音方法及装置有效
申请号: | 201911398661.3 | 申请日: | 2019-12-30 |
公开(公告)号: | CN111128186B | 公开(公告)日: | 2022-06-17 |
发明(设计)人: | 王鸣 | 申请(专利权)人: | 云知声智能科技股份有限公司;厦门云知芯智能科技有限公司 |
主分类号: | G10L15/26 | 分类号: | G10L15/26;G10L15/06 |
代理公司: | 北京冠和权律师事务所 11399 | 代理人: | 张楠楠 |
地址: | 100000 北京市海*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 多音字 方法 装置 | ||
本发明是关于多音字标音方法及装置。该方法包括:获取语音交互信息;识别所述语音交互信息,获得语音识别结果;基于所述语音识别结果,得到语音反馈信息;确定所述语音反馈信息中的待注音词汇;利用预设声学模型对所述待标音词汇进行标音。通过本发明的技术方案,可利用该预设声学模型对该待标音词汇自动进行标音,以提高标音效率和准确率,避免人为标注发音。
技术领域
本发明涉及终端技术领域,尤其涉及多音字标音方法及装置。
背景技术
目前,在对多音字进行标注时,通常都是按照预先设置的规则从多音字的多个发音中选择一个发音进行标注,甚至是手动对多音字的发音进行标注,以确保多音字的发音是正确的,而这种标音方式准确率比较低,甚至需要过多人为操作。
发明内容
本发明实施例提供了多音字标音方法及装置。所述技术方案如下:
根据本发明实施例的第一方面,提供一种多音字标音方法,包括:
获取语音交互信息;
识别所述语音交互信息,获得语音识别结果;
基于所述语音识别结果,得到语音反馈信息;
确定所述语音反馈信息中的待注音词汇;
利用预设声学模型对所述待标音词汇进行标音。
在一个实施例中,所述方法还包括:
获取预设语言模型和预设注音词典;
利用所述预设语言模型和所述预设注音词典,对标音后的所述待标音词汇进行注音校正。
在一个实施例中,将注音校正后的所述待标音词汇加入所述预设注音词典,以更新所述预设注音词典。
在一个实施例中,所述确定所述语音反馈信息中的待注音词汇,包括:
确定所述语音反馈信息中的多个实体;
根据所述多个实体中各实体是否为多音字,确定所述待标音词汇;
所述利用预设声学模型对所述待标音词汇进行标音,包括:
当所述语音交互信息包括所述待标音词汇时,基于所述语音交互信息中所述待标音词汇的发音、所述语音交互信息中除所述待标音词汇之外的其他词汇的发音以及所述预设声学模型,对所述语音反馈信息中的待标音词汇进行标音;
所述方法还包括:
将对所述待标音词汇进行标音后的语音反馈信息进行播报。
根据本发明实施例的第二方面,提供一种多音字标音装置,包括:
第一获取模块,用于获取语音交互信息;
识别模块,用于识别所述语音交互信息,获得语音识别结果;
处理模块,用于基于所述语音识别结果,得到语音反馈信息;
确定模块,用于确定所述语音反馈信息中的待注音词汇;
标音模块,用于利用预设声学模型对所述待标音词汇进行标音。
在一个实施例中,所述装置还包括:
第二获取模块,用于获取预设语言模型和预设注音词典;
校正模块,用于利用所述预设语言模型和所述预设注音词典,对标音后的所述待标音词汇进行注音校正。
在一个实施例中,更新模块,用于将注音校正后的所述待标音词汇加入所述预设注音词典,以更新所述预设注音词典。
在一个实施例中,所述确定模块包括:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于云知声智能科技股份有限公司;厦门云知芯智能科技有限公司,未经云知声智能科技股份有限公司;厦门云知芯智能科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201911398661.3/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一体式输送成型机及使用方法
- 下一篇:金属层布局结构及功率器件