[发明专利]制作逐字歌词的方法、装置、终端和非临时性计算机可读存储介质有效
申请号: | 202010301384.6 | 申请日: | 2020-04-16 |
公开(公告)号: | CN111507254B | 公开(公告)日: | 2023-10-24 |
发明(设计)人: | 马哲;高超 | 申请(专利权)人: | 北京雷石天地电子技术有限公司 |
主分类号: | G06V30/41 | 分类号: | G06V30/41;G06V30/414;G06V30/16;G06V30/162;G06V30/18;G10L25/51 |
代理公司: | 深圳壹舟知识产权代理事务所(普通合伙) 44331 | 代理人: | 寇闯 |
地址: | 100000 北京市*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 制作 逐字 歌词 方法 装置 终端 临时性 计算机 可读 存储 介质 | ||
本发明涉及语音信号处理技术领域,提供了制作逐字歌词的方法、装置终端和非临时性计算机可读存储介质,以实现逐字歌词的高效、精准制作。所述方法包括:获取待制作逐字歌词的音频文件的频域音频片段;判断频域音频片段中时域上两两紧邻的频域音频片段之间的频率是否发生跳变;若时域上两两紧邻的频域音频片段之间的频率发生跳变,则记录跳变的时刻;从跳变的时刻开始,对音频文件进行文字识别;将识别出来的文字生成逐字歌词文件。相对于现有的人工逐字歌词制作过程效率低下和精准度差的缺陷,本发明实现了逐字歌词制作效率高和精准度高等两方面的效果。
技术领域
本发明涉及语音信号处理技术领域,特别涉及一种制作逐字歌词的方法、装置、终端和非临时性计算机可读存储介质。
背景技术
目前,市面上主流的音乐播放软件有逐行歌词和逐字歌词,与逐行歌词不同的是,逐字歌词的每个歌词文字都有独立的时间戳,播放器可以根据当前播放进度并依靠时间戳精确定位到歌曲唱到哪个字,便于在界面上精确地显示歌词进度。
现有的一种逐字歌词制作方法是人工制作,具体而言,就是通过人工一边听目标歌曲,一边对照目标歌曲的歌词,手工记录歌词中每一个字的开始时刻和结束时刻,然后按照格式填写,制作成相应的文件,最后再做一次检查,以修正前述制作过程中的错误。
显然,现有的逐字歌词制作方法一个较大的缺陷就是效率低下,尤其在歌词较长时,可能需要几个小时才能完成一首歌的逐字歌词制作;另一方面,若长时间听歌,人耳容易产生听觉疲劳,出现短暂的听觉反应迟钝,这也给制作的精准度带来影响即精准度会下降,例如,字的开始时刻被判断延迟或结束时刻被判断提前,等等。
发明内容
本发明提供一种制作逐字歌词的方法、装置、终端和非临时性计算机可读存储介质,以实现逐字歌词的高效、精准制作。
一方面,本发明提供了一种制作逐字歌词的方法,包括:
获取待制作逐字歌词的音频文件的频域音频片段;
判断频域音频片段中时域上两两紧邻的频域音频片段之间的频率是否发生跳变;
若时域上两两紧邻的频域音频片段之间的频率发生跳变,则记录跳变的时刻;
从跳变的时刻开始,对音频文件进行文字识别;
将识别出来的文字生成逐字歌词文件。
具体地,所述判断频域音频片段中时域上两两紧邻的频域音频片段之间的频率是否发生跳变,包括:
通过聚类算法,计算当前频域音频片段与当前频域音频片段紧邻的频域音频片段是否属于同一类别;
若当前频域音频片段与当前频域音频片段紧邻的频域音频片段不属于同一类别,则确定当前频域音频片段与当前频域音频片段紧邻的频域音频片段之间的频率发生跳变。
具体地,所述从跳变的时刻开始,对音频文件进行文字识别,包括:
去除音频文件中文字区域的图片背景;
通过边缘检测算法,获取已去除图片背景的音频文件中的预处理文字图片;
对预处理文字图片做进一步筛选,识别出音频文件中的文字。
具体地,所述通过边缘检测算法,获取已去除图片背景的音频文件中的预处理文字图片,包括:
对文字区域的图像二值化;
对二值化后的图像进行膨胀和腐蚀的形态化操作,得到预处理文字图片。
具体地,所述获取待制作逐字歌词的音频文件的频域音频片段,包括:
将待制作逐字歌词的音频文件在时域上切分成若干等长的音频片段;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京雷石天地电子技术有限公司,未经北京雷石天地电子技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010301384.6/2.html,转载请声明来源钻瓜专利网。