[发明专利]用于确定文本的拼音的方法、装置、系统和存储介质有效

申请号：	201910647900.8	申请日：	2019-07-17
公开（公告）号：	CN110377882B	公开（公告）日：	2023-06-09
发明（设计）人：	潘华山;李秀林	申请（专利权）人：	标贝（深圳）科技有限公司
主分类号：	G06F40/117	分类号：	G06F40/117;G06F40/247
代理公司：	北京睿邦知识产权代理事务所(普通合伙) 11481	代理人：	徐丁峰;张玮
地址：	518000 广东省深圳市福田区福田街***	国省代码：	广东;44
权利要求书：	查看更多	说明书：	查看更多
摘要：
搜索关键词：	用于确定文本拼音方法装置系统存储介质
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【说明书】：

本发明实施例提供了用于确定文本的拼音的方法、装置、系统、存储介质以及语音合成方法。所述方法包括：确定所述文本中的多音字的候选拼音；至少根据所述文本中的多音字的候选拼音，确定所述文本的掩码；提取所述文本中的汉字的特征；基于所提取的特征，利用预测模型预测对应汉字的拼音；以及基于预测结果和所述文本的掩码确定所述文本的拼音。上述自动确定文本的拼音的技术方案中，无需人工手动操作，通过掩码来限制文本中汉字的候选拼音的范围，有效防止了将多音字的拼音预测错误的情况，提高了文本的拼音的预测准确率。

技术领域

本发明涉及语音分析和处理领域，更具体地涉及一种用于确定文本的拼音的方法、装置、系统、存储介质以及语音合成方法。

背景技术

在语音分析和处理技术领域中，汉字到拼音的转换直接影响着语音分析处理的准确度。具体例如，在语音合成技术中，其直接影响所合成的语音的可懂度。因此，提高汉字的拼音标注的准确率具有重要意义。

目前，现有的汉字拼音标注方法大体基于以下内容来实现：规则库和神经网络。基于规则库的方法虽然准确度较高，但是需要耗费大量的人力和物力来构建规则库且人工构建的规则库更新周期较长。此外，当规则库达到一定规模后，容易出现规则冲突等问题，较难扩展和维护。基于神经网络的方法通常针对每个多音字单独进行建模。每个多音字都训练一个标注模型，显著增加了系统开销。此外，基于神经网络的方法准确率还难以满足需求，容易发生预测错误。

总之，现有的用于确定文本的拼音的方法有待改善。

发明内容

考虑到上述问题而提出了本发明。

根据本发明一个方面，提供了一种用于确定文本的拼音的方法。所述方法包括：

确定所述文本中的多音字的候选拼音；

至少根据所述文本中的多音字的候选拼音，确定所述文本的掩码；

提取文本中的汉字的特征；

基于所提取的特征，利用预测模型预测对应汉字的拼音；以及

基于预测结果和所述文本的掩码确定所述文本的拼音。

示例性地，在确定文本的掩码之前，所述方法还包括：

确定所述文本中的单音字的候选拼音；

确定所述文本的掩码包括：