[发明专利]用于确定文本的拼音的方法、装置、系统和存储介质有效
申请号: | 201910647900.8 | 申请日: | 2019-07-17 |
公开(公告)号: | CN110377882B | 公开(公告)日: | 2023-06-09 |
发明(设计)人: | 潘华山;李秀林 | 申请(专利权)人: | 标贝(深圳)科技有限公司 |
主分类号: | G06F40/117 | 分类号: | G06F40/117;G06F40/247 |
代理公司: | 北京睿邦知识产权代理事务所(普通合伙) 11481 | 代理人: | 徐丁峰;张玮 |
地址: | 518000 广东省深圳市福田区福田街*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 用于 确定 文本 拼音 方法 装置 系统 存储 介质 | ||
1.一种用于确定文本的拼音的方法,包括:
确定所述文本中的多音字的候选拼音;
至少根据所述文本中的多音字的候选拼音,确定所述文本的掩码;
提取所述文本中的汉字的特征;
基于所提取的特征利用预测模型预测对应汉字的拼音;以及
基于预测结果和所述文本的掩码确定所述文本的拼音;
其中,对于所述文本中的每个汉字,
该汉字的预测结果用预测向量表示,所述预测向量中的每个元素对应于该汉字发出对应拼音的概率;
所述文本的掩码用掩码矩阵表示,所述掩码矩阵中的该汉字对应的掩码向量中的每个元素表示该汉字能否发出对应拼音;
所述基于预测结果和所述文本的掩码确定所述文本的拼音包括:
用所述预测向量中的元素乘以所述掩码向量中的对应元素,以确定所述文本中的该汉字的拼音。
2.如权利要求1所述的方法,其中,
在确定所述文本的掩码之前,所述方法还包括:
确定所述文本中的单音字的候选拼音;
所述确定所述文本的掩码包括:
根据所述文本中的每个汉字的候选拼音,确定每个汉字对应的掩码;
根据所述每个汉字对应的掩码,确定所述文本的掩码。
3.如权利要求1或2所述的方法,其中,所述提取所述文本中的汉字的特征包括:对于所述文本中的每个汉字,
确定该汉字的字符级特征;
将该汉字的字符级特征进行嵌入化处理;以及
根据经嵌入化处理的字符级特征获得该汉字的特征。
4.如权利要求3所述的方法,其中,
所述确定该汉字的字符级特征包括:确定该汉字的多个字符级特征;
所述根据经嵌入化处理的字符级特征获得该汉字的特征包括:
连接经嵌入化处理的多个字符级特征,以获得所述汉字的特征。
5.如权利要求4所述的方法,其中,所述多个字符级特征包括:字符级字面特征和字符级多音字标识特征。
6.如权利要求5所述的方法,其中,所述多个字符级特征还包括:中文分词特征、词性特征、句法特征和语义特征。
7.如权利要求3所述的方法,其中,对于所述文本中的每个汉字,
所述确定所述文本的掩码包括:确定所述文本中的该汉字的掩码;
所述提取所述文本中的汉字的特征还包括:
将该汉字的掩码进行嵌入化处理;
所述根据经嵌入化处理的字符级特征获得该汉字的特征包括:
连接经嵌入化处理的字符级特征和经嵌入化处理的掩码,以获得所述汉字的特征。
8.如权利要求1或2所述的方法,其中,所述预测模型是卷积神经网络模型、双向长短时记忆网络模型或序列到序列模型。
9.如权利要求1或2所述的方法,其中,所述方法还包括:
利用样本数据对所述预测模型进行训练。
10.一种语音合成方法,包括:
利用如权利要求1至9任一项所述的用于确定文本的拼音的方法,确定所述文本的拼音;以及
基于所确定的拼音,合成所述文本的语音。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于标贝(深圳)科技有限公司,未经标贝(深圳)科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910647900.8/1.html,转载请声明来源钻瓜专利网。