[发明专利]一种转换音频发声的方法、服务器及计算机可读存储介质在审
申请号: | 201710752085.2 | 申请日: | 2017-08-28 |
公开(公告)号: | CN107481735A | 公开(公告)日: | 2017-12-15 |
发明(设计)人: | 冯祖学 | 申请(专利权)人: | 中国移动通信集团公司;咪咕音乐有限公司;咪咕文化科技有限公司 |
主分类号: | G10L25/18 | 分类号: | G10L25/18;G10L21/013;G10L21/003;G10L19/02 |
代理公司: | 北京派特恩知识产权代理有限公司11270 | 代理人: | 张振伟,姚开丽 |
地址: | 100032 *** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 转换 音频 发声 方法 服务器 计算机 可读 存储 介质 | ||
1.一种转换音频发声的方法,其特征在于,所述方法包括:
获取待转换的音频数据及所述待转换音频数据的转换目标对象,对所述待转换的音频数据进行解析,得到解析结果,根据所述解析结果确定出所述待转换音频数据的音轨信息,其中,所述音轨信息至少包含所述待转换音频数据的音色;
在预设的声学频谱信息数据库中确定出所述转换目标对象的声学频谱信息,按照所述转换目标对象的声学频谱信息对所述待转换音频数据的音轨信息进行转换,确定出转换后的音频数据。
2.根据权利要求1所述的方法,其特征在于,所述获取待转换的音频数据及转换目标对象之前,所述方法还包括:
获取至少一个转换目标对象的声学频谱信息,将所述转换目标对象的声学频谱信息与所述转换目标对象的标识信息进行关联,生成声学频谱信息数据库。
3.根据权利要求2所述的方法,其特征在于,所述获取至少一个对象的声学频谱信息,包括:
对对象的声音进行采集,对获得的所述对象声音进行数模转换,获得所述对象的数字音频数据,根据所述数字音频数据对所述对象进行解析,获取所述对象的声学频谱信息,其中,所述对象的声学频谱信息至少包括所述对象发音的音节频谱信息。
4.根据权利要求1所述的方法,其特征在于,所述按照所述转换目标对象的声学频谱信息对所述待转换音频数据的音轨信息进行转换,包括:
根据所述目标转换对象的声学频谱信息中音频特征的音色对所述待转换音频数据的音轨信息中音节的音色进行调音。
5.一种转换音频发声装置,其特征在于,所述装置包括:
解析模块,用于获取待转换的音频数据及所述待转换音频数据的转换目标对象,对所述待转换的音频数据进行解析,得到解析结果,根据所述解析结果确定出所述待转换音频数据的音轨信息,其中,所述音轨信息至少包含所述待转换音频数据的音色;
转换模块,用于在预设的声学频谱信息数据库中确定出所述转换目标对象的声学频谱信息,按照所述转换目标对象的声学频谱信息对所述待转换音频数据的音轨信息进行转换,确定出转换后的音频数据。
6.根据权利要求5所述的装置,其特征在于,所述装置还包括:
生成模块,用于获取至少一个转换目标对象的声学频谱信息,将所述转换目标对象的声学频谱信息与所述转换目标对象的标识信息进行关联,生成声学频谱信息数据库。
7.根据权利要求6所述的装置,其特征在于,所述生成模块,具体用于:
对对象的声音进行采集,对获得的所述对象声音进行数模转换,获得所述对象的数字音频数据,根据所述数字音频数据对所述对象进行解析,获取所述对象的声学频谱信息,其中,所述对象的声学频谱信息至少包括所述对象发音的音节频谱信息。
8.根据权利要求6所述的装置,其特征在于,所述转换模块,具体用于:
根据所述目标转换对象的声学频谱信息中音频特征的音色对所述待转换音频数据的音轨信息中音节的音色进行调音。
9.一种服务器,其特征在于,包括:处理器和用于存储能够在处理器上运行的计算机程序的存储器,
其中,所述处理器用于运行所述计算机程序时,执行权利要求1至4任一所述方法的步骤。
10.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,该计算机程序被处理器执行时实现权利要求1至4任一所述方法的步骤。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国移动通信集团公司;咪咕音乐有限公司;咪咕文化科技有限公司,未经中国移动通信集团公司;咪咕音乐有限公司;咪咕文化科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201710752085.2/1.html,转载请声明来源钻瓜专利网。