[发明专利]一种中文语音合成归一化方法、装置及计算设备在审
申请号: | 202011097297.X | 申请日: | 2020-10-14 |
公开(公告)号: | CN114428831A | 公开(公告)日: | 2022-05-03 |
发明(设计)人: | 何朋;蒋宁;王洪斌;吴海英;权圣;杨春勇 | 申请(专利权)人: | 北京有限元科技有限公司 |
主分类号: | G06F16/33 | 分类号: | G06F16/33;G06F16/903;G10L13/08 |
代理公司: | 北京万思博知识产权代理有限公司 11694 | 代理人: | 高镇 |
地址: | 100080 北京市海淀区*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 中文 语音 合成 归一化 方法 装置 计算 设备 | ||
1.一种中文语音合成归一化方法,包括:
初始化一个大小为M×N、初始元素为0的矩阵P0,所述M为总的规则数量,所述N为待合成文本的长度;
使用所述M个规则分别对所述待合成文本进行扫描,若所述待合成文本共有t处满足第i个规则,i为1至M的任一整数,记所处t处中第r处的起始位置分别为sr和er,r为1至t的任一整数,则将所述矩阵P0的第i行的第sr至er个元素的值更新为任一非零数字,得到更新后的矩阵P1;
对所述矩阵P1的每一列进行扫描,当所述矩阵P1的某一列存在至少两个非零元素时,对所述至少两个非零元素所对应的规则分别进行优先级Q的计算,所述优先级Q的计算公式为:
其中,K为预设的优先级指标的数量,qk为预设的第k个优先级指标的优先级值;
对于所述矩阵P1的每一列的非零元素,保留优先级最高的规则所对应的元素的值,并将其他元素重新置零,得到合并后的矩阵P2,则所述矩阵P2的每个非零元素所对应的规则对该非零元素所对应的文本的识别结果即为归一化处理结果。
2.根据权利要求1所述的方法,其特征在于,所述优先级指标包括但不限于包含汉字、包含符号、包含英文字母、包含数字、以及匹配到文本的长度。
3.根据权利要求2所述的方法,其特征在于,
所述优先级指标“包含汉字”的优先级值、优先级指标“包含符号”的优先级值、优先级指标“包含英文字母”的优先级值、以及优先级指标“包含数字”的优先级值依次降低。
4.根据权利要求2或3所述的方法,其特征在于,所述优先级指标“匹配到文本的长度”的优先级值为匹配到文本的长度。
5.一种中文语音合成归一化装置,包括:
初始化模块,其配置成初始化一个大小为M×N、初始元素为0的矩阵P0,所述M为总的规则数量,所述N为待合成文本的长度;
矩阵更新模块,其配置成使用所述M个规则分别对所述待合成文本进行扫描,若所述待合成文本共有t处满足第i个规则,i为1至M的任一整数,记所处t处中第r处的起始位置分别为sr和er,r为1至t的任一整数,则将所述矩阵P0的第i行的第sr至er个元素的值更新为任一非零数字,得到更新后的矩阵P1;
优先级计算模块,其配置成对所述矩阵P1的每一列进行扫描,当所述矩阵P1的某一列存在至少两个非零元素时,则对所述至少两个非零元素所对应的规则分别进行优先级Q的计算,所述优先级Q的计算公式为:
其中,K为预设的优先级指标的数量,qk为预设的第k个优先级指标的优先级值;和
合并处理模块,其配置成对于所述矩阵P1的每一列的非零元素,保留优先级最高的规则所对应的元素的值,并将其他元素重新置零,得到合并后的矩阵P2,则所述矩阵P2的每个非零元素所对应的规则对该非零元素所对应的文本的识别结果即为归一化处理结果。
6.根据权利要求5所述的装置,其特征在于,所述优先级指标包括但不限于包含汉字、包含符号、包含英文字母、包含数字、以及匹配到文本的长度。
7.根据权利要求6所述的装置,其特征在于,
所述优先级指标“包含汉字”的优先级值、优先级指标“包含符号”的优先级值、优先级指标“包含英文字母”的优先级值、以及优先级指标“包含数字”的优先级值依次降低。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京有限元科技有限公司,未经北京有限元科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202011097297.X/1.html,转载请声明来源钻瓜专利网。