[发明专利]数据传输方法和装置有效
申请号: | 201810864442.9 | 申请日: | 2018-08-01 |
公开(公告)号: | CN110797004B | 公开(公告)日: | 2021-01-26 |
发明(设计)人: | 刘龙飞;盖于涛;祝晓林;杜春明;郭启行;杨松;陈山;郝庆畅 | 申请(专利权)人: | 百度在线网络技术(北京)有限公司 |
主分类号: | G10L13/10 | 分类号: | G10L13/10;G10L19/00;G10L19/04 |
代理公司: | 北京英赛嘉华知识产权代理有限责任公司 11204 | 代理人: | 王达佐;马晓亚 |
地址: | 100085 北京市*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 数据传输 方法 装置 | ||
1.一种数据传输方法,包括:
基于音频数据中的边界信息,对所述音频数据进行切分,得到多个包数据;其中,所述音频数据至少包括以下一种:文本的合成语音、音乐,当所述音频数据为所述文本的合成语音的音频数据时所述边界信息与文本的韵律信息相关联,当所述音频数据为所述音乐的音频数据时所述边界信息与所述音乐的节拍信息相关联;
对多个包数据中的每一个包数据进行编码,得到每一个包数据对应的编码后的包数据,以及按照对应的播放次序,将每一个包数据对应的编码后的包数据发送至终端。
2.根据权利要求1所述的方法,包数据包括至少一个对应于文字的语音。
3.根据权利要求2所述的方法,音频数据为文本的合成语音,对应于文字的语音为对应于所述文本中的文字的语音,所述文本的合成语音通过采用预设语音合成方式基于所述文本而生成,预设语音合成方式包括以下之一:拼接合成方式、参数合成方式。
4.根据权利要求3所述的方法,边界信息为从音库中选取出的文字的语音单元的边界信息。
5.根据权利要求3所述的方法,边界信息为通过时长预测模型预测出的文字的边界信息。
6.根据权利要求3-5之一所述的方法,基于音频数据中的边界信息,对所述音频数据进行切分,得到多个包数据包括:
基于文本的合成语音中的对应于所述文本中的文字的语音的边界信息和预设语音数量,对文本的合成语音进行切分,得到多个包数据,其中,当包数据中包括的文字的语音的数量为预设语音数量时,包数据对应的响应时长小于时长阈值,包数据对应的响应时长为发送包数据的时刻和终端接收到包数据的时刻之间的时长。
7.根据权利要求6所述的方法,所述方法还包括:
当通过一次测试操作判断出首个包数据对应的响应时长小于或等于时长阈值时,将在所述测试操作中基于的语音数量参数的参数值作为预设语音数量,测试操作包括:基于语音数量参数的参数值,对用于测试的语音进行切分;判断切分后得到的所有包数据中的首个包数据对应响应时长是否大于时长阈值,其中,切分后得到的包数据中的文字的语音的数量为所述语音数量参数的参数值;
当通过一次测试操作判断出首个包数据对应响应时长大于时长阈值时,将语音数量参数的参数值减小预设值,以及再次执行测试操作。
8.根据权利要求7所述的方法,对多个包数据中的每一个包数据进行编码,得到每一个包数据对应的编码后的包数据,以及按照对应的播放次序,将每一个包数据对应的编码后的包数据发送至终端包括:
生成每一个包数据对应的扩展包数据,包数据对应的扩展包数据包括:所述包数据、在对应的播放次序上与所述包数据相邻的其他的包数据中的部分数据;
对每一个包数据对应的扩展包数据进行编码,得到每一个包数据对应的编码后的包数据;
按照对应的播放次序,将每一个包数据对应的编码后的包数据发送至终端,其中,包数据对应的编码后的包数据在终端上被解码,得到包数据对应的扩展包数据并且包数据对应的扩展包数据在终端上被去除属于其他的包数据的数据,得到包数据。
9.一种数据传输装置,包括:
切分单元,被配置为基于音频数据中的边界信息,对所述音频数据进行切分,得到多个包数据;其中,所述音频数据至少包括以下一种:文本的合成语音、音乐,当所述音频数据为所述文本的合成语音的音频数据时所述边界信息与文本的韵律信息相关联,当所述音频数据为所述音乐的音频数据时所述边界信息与所述音乐的节拍信息相关联;
传输单元,被配置为对多个包数据中的每一个包数据进行编码,得到每一个包数据对应的编码后的包数据,以及按照对应的播放次序,将每一个包数据对应的编码后的包数据发送至终端。
10.根据权利要求9所述的装置,包数据包括至少一个对应于文字的语音。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于百度在线网络技术(北京)有限公司,未经百度在线网络技术(北京)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201810864442.9/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种文本转语音显示字幕信息的方法
- 下一篇:韵律预测方法、装置、设备和介质