[发明专利]歌曲处理方法、装置、计算机设备、存储介质及程序产品有效
申请号: | 202111214403.2 | 申请日: | 2021-10-19 |
公开(公告)号: | CN113658570B | 公开(公告)日: | 2022-02-11 |
发明(设计)人: | 莫建烨;孙晓辉;徐振;王宗晟;梁昊龙;王宝勋 | 申请(专利权)人: | 腾讯科技(深圳)有限公司 |
主分类号: | G10H1/40 | 分类号: | G10H1/40 |
代理公司: | 广州三环专利商标代理有限公司 44202 | 代理人: | 熊永强;杜维 |
地址: | 518057 广东省深圳*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 歌曲 处理 方法 装置 计算机 设备 存储 介质 程序 产品 | ||
本申请实施例提供了一种歌曲处理方法、装置、计算机设备、存储介质及程序产品,该歌曲处理方法包括:从待处理的目标歌曲中提取演唱音频和伴奏音频,演唱音频包括一个或多个音频段;对演唱音频中的各个音频段进行节奏识别处理,得到各个音频段的初始节奏信息;基于伴奏音频确定目标歌曲对应的节奏规整标准;按照节奏规整标准,对各个音频段的初始节奏信息进行节奏校准处理,得到各个音频段的目标节奏信息。采用本申请实施例,可以高效且准确地获取歌曲中的节奏信息。
技术领域
本申请涉及计算机技术领域,尤其涉及一种歌曲处理方法、装置、计算机设备、存储介质及程序产品。
背景技术
随着计算机技术领域中TTS(Text-to-Speech,语音合成)技术的不断发展,语音在各类应用场景中的自动生成任务也被不断探索,歌曲合成作为TTS技术在歌曲应用场景中延伸出的新兴研究领域,受到了学者们的广泛关注。歌曲合成简单来说就是根据伴奏音频、节奏信息、以及语音等合成一首歌曲的过程,在歌曲合成的过程中,节奏信息是决定合成的歌曲是否符合乐理听感的关键因素,因此,如何获取节奏信息成为歌曲合成过程中的关键问题。
目前,节奏信息的获取主要依靠两种途径,第一种是人工手动编写节奏信息,第二种是直接获取现有歌曲中的节奏信息,前者需要具备创作能力的专业人员,更加可行的方法往往是后者。而后者同样依赖于人工,由标注人员标注现有歌曲中的节奏信息,在这样的节奏信息获取方式中,节奏信息的标注速度依赖于标注人员的专业程度和熟练程度,并且长时间进行标注容易造成听觉疲劳从而导致标注的节奏信息不准确;可见,目前的节奏信息获取方式在效率和准确率上均存在不足。
发明内容
本申请实施例提供了一种歌曲处理方法、装置、计算机设备、存储介质及程序产品,可以高效且准确地获取歌曲中的节奏信息。
一方面,本申请实施例提供了一种歌曲处理方法,该歌曲处理方法包括:
从待处理的目标歌曲中提取演唱音频和伴奏音频,演唱音频包括一个或多个音频段;
对演唱音频中的各个音频段进行节奏识别处理,得到各个音频段的初始节奏信息;
基于伴奏音频确定目标歌曲对应的节奏规整标准;
按照节奏规整标准,对各个音频段的初始节奏信息进行节奏校准处理,得到各个音频段的目标节奏信息。
相应地,本申请实施例提供了一种歌曲处理装置,该歌曲处理装置包括:
获取单元,用于获取待处理的目标歌曲;
处理单元,用于从待处理的目标歌曲中提取演唱音频和伴奏音频,演唱音频包括一个或多个音频段;
处理单元,还用于对演唱音频中的各个音频段进行节奏识别处理,得到各个音频段的初始节奏信息;
基于伴奏音频确定目标歌曲对应的节奏规整标准;按照节奏规整标准,对各个音频段的初始节奏信息进行节奏校准处理,得到各个音频段的目标节奏信息。
在一种实现方式中,演唱音频中包括N个音频段,N为正整数;N个音频段中的任一个音频段表示为第i个音频段,i为小于或等于N的正整数;对第i个音频段进行节奏识别处理还得到一个或多个识别字符;第i个音频段的初始节奏信息包括每个识别字符的识别发音时长,第i个音频段的目标节奏信息包括每个识别字符的目标发音时长;
处理单元,用于按照节奏规整标准,对第i个音频段的初始节奏信息进行节奏校准处理,得到第i个音频段的目标节奏信息时,具体用于执行如下步骤:按照节奏规整标准,对第i个音频段的初始节奏信息中各个识别字符的识别发音时长进行发音时长校准处理,得到第i个音频段的目标节奏信息中各个识别字符的目标发音时长。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于腾讯科技(深圳)有限公司,未经腾讯科技(深圳)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202111214403.2/2.html,转载请声明来源钻瓜专利网。