[发明专利]用于确定文本的拼音的方法、装置、系统和存储介质有效
申请号: | 201910647900.8 | 申请日: | 2019-07-17 |
公开(公告)号: | CN110377882B | 公开(公告)日: | 2023-06-09 |
发明(设计)人: | 潘华山;李秀林 | 申请(专利权)人: | 标贝(深圳)科技有限公司 |
主分类号: | G06F40/117 | 分类号: | G06F40/117;G06F40/247 |
代理公司: | 北京睿邦知识产权代理事务所(普通合伙) 11481 | 代理人: | 徐丁峰;张玮 |
地址: | 518000 广东省深圳市福田区福田街*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 用于 确定 文本 拼音 方法 装置 系统 存储 介质 | ||
本发明实施例提供了用于确定文本的拼音的方法、装置、系统、存储介质以及语音合成方法。所述方法包括:确定所述文本中的多音字的候选拼音;至少根据所述文本中的多音字的候选拼音,确定所述文本的掩码;提取所述文本中的汉字的特征;基于所提取的特征,利用预测模型预测对应汉字的拼音;以及基于预测结果和所述文本的掩码确定所述文本的拼音。上述自动确定文本的拼音的技术方案中,无需人工手动操作,通过掩码来限制文本中汉字的候选拼音的范围,有效防止了将多音字的拼音预测错误的情况,提高了文本的拼音的预测准确率。
技术领域
本发明涉及语音分析和处理领域,更具体地涉及一种用于确定文本的拼音的方法、装置、系统、存储介质以及语音合成方法。
背景技术
在语音分析和处理技术领域中,汉字到拼音的转换直接影响着语音分析处理的准确度。具体例如,在语音合成技术中,其直接影响所合成的语音的可懂度。因此,提高汉字的拼音标注的准确率具有重要意义。
目前,现有的汉字拼音标注方法大体基于以下内容来实现:规则库和神经网络。基于规则库的方法虽然准确度较高,但是需要耗费大量的人力和物力来构建规则库且人工构建的规则库更新周期较长。此外,当规则库达到一定规模后,容易出现规则冲突等问题,较难扩展和维护。基于神经网络的方法通常针对每个多音字单独进行建模。每个多音字都训练一个标注模型,显著增加了系统开销。此外,基于神经网络的方法准确率还难以满足需求,容易发生预测错误。
总之,现有的用于确定文本的拼音的方法有待改善。
发明内容
考虑到上述问题而提出了本发明。
根据本发明一个方面,提供了一种用于确定文本的拼音的方法。所述方法包括:
确定所述文本中的多音字的候选拼音;
至少根据所述文本中的多音字的候选拼音,确定所述文本的掩码;
提取文本中的汉字的特征;
基于所提取的特征,利用预测模型预测对应汉字的拼音;以及
基于预测结果和所述文本的掩码确定所述文本的拼音。
示例性地,在确定文本的掩码之前,所述方法还包括:
确定所述文本中的单音字的候选拼音;
确定所述文本的掩码包括:
根据所述文本中的每个汉字的候选拼音,确定每个汉字对应的掩码;以及
根据所述每个汉字对应的掩码,确定所述文本的掩码。
示例性地,对于所述文本中的每个汉字,该汉字的预测结果用预测向量表示,所述预测向量中的每个元素表示该汉字发出对应拼音的概率;
所述文本的掩码用掩码矩阵表示,所述掩码矩阵中的该汉字对应的向量中的每个元素表示该汉字能否发出对应拼音;
基于预测结果和所述文本的掩码确定所述文本的拼音包括:
用所述预测向量中的元素乘以所述掩码向量中的对应元素,以确定所述文本中的该汉字的拼音。
示例性地,所述提取所述文本中的汉字的特征包括:对于所述文本中的每个汉字,
确定该汉字的字符级特征;
将该汉字的字符级特征进行嵌入化处理;以及
根据经嵌入化处理的字符级特征获得该汉字的特征。
示例性地,所述确定该汉字的字符级特征包括:确定该汉字的多个字符级特征;
所述根据经嵌入化处理的字符级特征获得该汉字的特征包括:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于标贝(深圳)科技有限公司,未经标贝(深圳)科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910647900.8/2.html,转载请声明来源钻瓜专利网。