[发明专利]歌词文件的生成方法及装置在审

申请号：	201510938239.8	申请日：	2015-12-15
公开（公告）号：	CN105575414A	公开（公告）日：	2016-05-11
发明（设计）人：	武大伟	申请（专利权）人：	广州酷狗计算机科技有限公司
主分类号：	G11B27/10	分类号：	G11B27/10
代理公司：	北京三高永信知识产权代理有限责任公司 11138	代理人：	江崇玉
地址：	510660 广东省广州***	国省代码：	广东;44
权利要求书：	查看更多	说明书：	查看更多
摘要：	本发明公开了一种歌词文件的生成方法及装置，属于音频处理技术领域。该方法包括：获取目标音频文件及参考音频文件，目标音频文件与参考音频文件为同一音频文件的不同版本；分别对目标音频文件和参考音频文件进行特征提取，得到第一音频特征和第二音频特征；根据第一音频特征和第二音频特征，计算目标音频文件与参考音频文件之间的时间偏差；根据时间偏差，调整参考音频文件对应歌词文件的时间戳，得到目标音频文件对应的歌词文件。本发明对于同一音频文件的不同版本，通过调整参考音频文件对应的歌词文件，即可为目标音频文件生成对应的歌词文件，无需重复生成多个歌词文件，提高了音频文件的制作效率，降低了制作成本。
搜索关键词：	歌词文件生成方法装置
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【主权项】：

1.一种歌词文件的生成方法，其特征在于，所述方法包括：获取目标音频文件及参考音频文件，所述目标音频文件与所述参考音频文件为同一音频文件的不同版本；采用预设频率对所述目标音频文件进行重采样；将重采样后的目标音频文件划分为多个音频片段，每个音频片段中包含预设数量个采样点；对于任意相邻的第一音频片段和第二音频片段，采用汉宁窗函数进行处理，得到第一加窗音频片段和第二加窗音频片段；对所述第一加窗音频片段和所述第二加窗音频片段分别进行快速傅里叶变换FFT，得到所述第一音频片段对应的第一频谱和所述第二音频片段对应的第二频谱；对所述第一频谱和所述第二频谱分别进行映射，得到所述第一音频片段对应的多个第一频率点和所述第二音频片段对应的多个第二频率点，所述第一频率点和所述第二频率点的数量相同；根据所述多个第一频率点和所述多个第二频率点，获取所述第一音频片段的音频特征值；对所述多个音频片段的音频特征值进行组合，得到第一音频特征；按照对所述目标音频文件进行特征提取得到所述第一音频特征的方法，对所述参考音频文件进行特征提取得到第二音频特征；根据所述第一音频特征和所述第二音频特征，计算所述目标音频文件与所述参考音频文件之间的时间偏差；根据所述时间偏差，调整所述参考音频文件对应歌词文件的时间戳，得到所述目标音频文件对应的歌词文件。

下载完整专利技术内容需要扣除积分，VIP会员可以免费下载。

免登录下载普通用户下载升级VIP会员，免费下载

该专利技术资料仅供研究查看技术是否侵权等信息，商用须获得专利权人授权。该专利全部权利属于广州酷狗计算机科技有限公司，未经广州酷狗计算机科技有限公司许可，擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作，请联系【客服】

本文链接：http://www.vipzhuanli.com/patent/201510938239.8/，转载请声明来源钻瓜专利网。

同类专利

专利分类

G 物理

G11 信息存储
G11B 基于记录载体和换能器之间的相对运动而实现的信息存储
G11B27-00 编辑；索引；寻址；定时或同步；监控；磁带行程的测量
G11B27-02 .编辑，例如，改变记录在记录载体上或从记录载体上重现的信息信号的次序
G11B27-10 .索引；寻址；定时或同步；磁带行程的测量
G11B27-36 .监控；即监控记录或重现的进程
G11B27-11 ..利用在记录载体上检测不到的信息的
G11B27-19 ..利用在记录载体上可检测到的信息的

免登录下载普通用户下载升级VIP会员，免费下载

[发明专利]歌词文件的生成方法及装置在审

专利文献下载