[发明专利]语音合成编码方法及装置在审
申请号: | 202110647984.2 | 申请日: | 2021-06-10 |
公开(公告)号: | CN113380220A | 公开(公告)日: | 2021-09-10 |
发明(设计)人: | 皮碧虹;杨德文;龙丁奋 | 申请(专利权)人: | 深圳市同行者科技有限公司 |
主分类号: | G10L13/02 | 分类号: | G10L13/02;G10L13/04 |
代理公司: | 深圳市特讯知识产权代理事务所(普通合伙) 44653 | 代理人: | 孟智广 |
地址: | 518000 广东省深圳市南山区粤海街道高*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 语音 合成 编码 方法 装置 | ||
1.一种语音合成编码方法,其特征在于,包括:
开始将文本数据合成为pcm流数据,并将所述pcm流数据存储于缓冲区;
根据当前系统负载情况动态计算开始播放需要的起始缓冲阈值Tstart;
若缓冲区缓冲时长大于所述起始缓冲阈值Tstart时,读取缓冲区的所述pcm流数据进行播放;
根据当前系统负载情况动态计算持续播放需要的持续缓冲阈值Tblock;
若缓冲区缓冲时长大于所述持续缓冲阈值Tblock,则暂停将文本数据合成为pcm流数据,并等待预设时间后返回计算持续缓冲阈值Tblock的步骤;否则,持续将文本数据合成为pcm流数据,并等待预设时间后返回计算持续缓冲阈值Tblock的步骤,直至将全部的文本数据合成为pcm流数据。
2.根据权利要求1所述的语音合成编码方法,其特征在于,所述根据当前系统负载情况动态计算开始播放需要的起始缓冲阈值Tstart,包括:
若T2-T1Tmin,则Tstart=Tmin,否则Tstart=T2-T1;
其中,T1为合成时长预估;
T2为播放时长;
Tmin为最小缓冲时长。
3.根据权利要求2所述的语音合成编码方法,其特征在于,T1=L*U/C,T2=L*T;
其中,C为单核cpu最大空闲算力;U为单字合成算力消耗;T为单字时长预估;L为整句字长。
4.根据权利要求1所述的语音合成编码方法,其特征在于,所述根据当前系统负载情况动态计算持续播放需要的持续缓冲阈值Tblock,包括:
若T4≤T3,Tblock=T3,否则Tblock=x*(T2-T1)+Tbuf;
若Tblock<Tmin,则Tblock=Tmin;
其中,T4为剩余播放时长预估,T3为剩余合成时长预估,Tbuf为当前缓冲区剩余播放时长,x为缓冲单位。
5.根据权利要求4所述的语音合成编码方法,其特征在于,T3=R*U/C,T4=R*T+Tbuf,Tmin=F*Tplayer;
其中,C为单核cpu最大空闲算力;U为单字合成算力消耗;R为剩余字长,F为最小播放缓冲系数,Tplayer为播放器最小缓冲区缓冲时长,T为单字时长预估。
6.根据权利要求5所述的语音合成编码方法,其特征在于,所述缓冲单位x=1%,所述最小播放缓冲系数F=2。
7.根据权利要求1所述的语音合成编码方法,其特征在于,还包括暂停播放所述pcm流数据的步骤。
8.一种语音合成编码装置,其特征在于,包括:
缓冲模块,用于开始将文本数据合成为pcm流数据,并将所述pcm流数据存储于缓冲区;
第一计算模块,用于根据当前系统负载情况动态计算开始播放需要的起始缓冲阈值Tstart;
播放模块,当缓冲区缓冲时长大于所述起始缓冲阈值Tstart时,用于读取缓冲区的所述pcm流数据进行播放;
第二计算模块,用于根据当前系统负载情况动态计算持续播放需要的持续缓冲阈值Tblock;
判断模块,用于若缓冲区缓冲时长大于所述持续缓冲阈值Tblock,则暂停将文本数据合成为pcm流数据,并等待预设时间后返回计算持续缓冲阈值Tblock的步骤;否则,持续将文本数据合成为pcm流数据,并等待预设时间后返回计算持续缓冲阈值Tblock的步骤,直至将全部的文本数据合成为pcm流数据。
9.根据权利要求8所述的语音合成编码装置,其特征在于,所述第一计算模块用于
若T2-T1Tmin,则Tstart=Tmin,否则Tstart=T2-T1;
其中,T1为合成时长预估;
T2为播放时长;
Tmin为最小缓冲时长。
10.根据权利要求8所述的语音合成编码装置,其特征在于,所述第二计算模块用于
若T4≤T3,Tblock=T3,否则Tblock=x*(T2-T1)+Tbuf;
若Tblock<Tmin,则Tblock=Tmin;
其中,T4为剩余播放时长预估,T3为剩余合成时长预估,Tbuf为当前缓冲区剩余播放时长,x为缓冲单位。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于深圳市同行者科技有限公司,未经深圳市同行者科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110647984.2/1.html,转载请声明来源钻瓜专利网。