[发明专利]基于相似矩阵的音乐自动剪辑实现方法、装置及存储介质有效
申请号: | 202110218414.1 | 申请日: | 2021-02-26 |
公开(公告)号: | CN113035160B | 公开(公告)日: | 2022-08-02 |
发明(设计)人: | 尹学渊;王东明;江天宇 | 申请(专利权)人: | 成都潜在人工智能科技有限公司 |
主分类号: | G10H1/00 | 分类号: | G10H1/00 |
代理公司: | 成都睿道专利代理事务所(普通合伙) 51217 | 代理人: | 贺理兴 |
地址: | 610000 四川省成都市高新区*** | 国省代码: | 四川;51 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 相似 矩阵 音乐 自动 剪辑 实现 方法 装置 存储 介质 | ||
本发明提供一种基于相似矩阵的音乐自动剪辑实现方法、装置及存储介质,包括S1.获取待剪辑的音频文件和预设剪辑时长范围;S2.将所述音频文件转换为对应的色谱图,并利用相似矩阵对副歌片段进行定位;S3.通过预设窗口对所述副歌片段的能量进行分析,获取所述副歌片段中的高潮片段;S4.通过微调窗口对所述高潮片段进行微调,获取所述高潮片段的起始时间点;S5.通过人声检测模型进行人声检测,获取所述高潮片段的结束时间点;S6.根据所述起始时间点和所述结束时间点剪辑得到对应的音频片段。通过上述方式,提高了音频剪辑的效率和准确性,降低了剪辑成本。
技术领域
本发明涉及互联网技术领域,具体而言,涉及一种基于相似矩阵的音乐自动剪辑实现方法、装置及存储介质。
背景技术
目前,除开普通用户对于音乐的需求以外,现兴起的短时频、直播行业同样对音乐有着很大的需求。因此,对于音乐售卖方,能够提供一个片段让用户进行试听选择的功能至关重要。但是,音乐行业还是一个偏传统的行业,音乐编辑仍然需要人工使用编辑软件对每一首歌试听后截取高潮片段;这不但增加了人工成本,而且效率也不高。所以需要提供一种方案以便于在提高音乐剪辑的效率和准确性的同时降低剪辑成本。
发明内容
本发明的目的在于提供一种基于相似矩阵的音乐自动剪辑实现方法、装置及存储介质,用以实现在提高音乐剪辑的效率和准确性的同时降低剪辑成本的技术效果。
第一方面,本发明提供了一种基于相似矩阵的音乐自动剪辑实现方法,包括:
S1.获取待剪辑的音频文件和预设剪辑时长范围;
S2.将所述音频文件转换为对应的色谱图,并利用相似矩阵对副歌片段进行定位;
S3.通过预设窗口对所述副歌片段的能量进行分析,获取所述副歌片段中的高潮片段;
S4.通过微调窗口对所述高潮片段进行微调,获取所述高潮片段的起始时间点;
S5.通过人声检测模型进行人声检测,获取所述高潮片段的结束时间点;
S6.根据所述起始时间点和所述结束时间点剪辑得到对应的音频片段。
进一步地,所述S2包括:
以一帧为单位构建所述音频文件的色谱图;
根据所述色谱图分析各帧歌曲的相似度;
将所述相似度按照时间维度构建相似矩阵;
根据所述相似矩阵分析最优副歌片段。
进一步地,将所述相似度按照时间维度构建相似矩阵的步骤包括:
根据公式(1)计算两帧歌曲的相似度;根据公式(2)构建相似矩阵:
M[x][y]=similarity(x,y) (2)
式中,x和y表示不同的两帧歌曲对应的音符向量;similarity表示相似度;M表示相似度矩阵。
进一步地,根据所述相似矩阵分析最优副歌片段的步骤包括:
根据所述相似度矩阵构建延时矩阵,将所述相似度矩阵中倾斜的对角线通过线性变换转换为平铺的直线;
根据设置的阈值对所述延时矩阵进行降噪平滑处理;
将降噪平滑处理后的延时矩阵中的线条按照时间点进行统计;
定义每一条直线的权重,根据各个时间点重叠的线条数进行加权求和,计算该直线的总权重;
将总权重最大的直线对应的歌曲片段作为最优副歌片段。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于成都潜在人工智能科技有限公司,未经成都潜在人工智能科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110218414.1/2.html,转载请声明来源钻瓜专利网。