[发明专利]歌曲文件的歌词匹配方法和装置在审
申请号: | 202111287359.8 | 申请日: | 2021-11-02 |
公开(公告)号: | CN114020959A | 公开(公告)日: | 2022-02-08 |
发明(设计)人: | 徐焕芬;周跃兵 | 申请(专利权)人: | 广州艾美网络科技有限公司 |
主分类号: | G06F16/683 | 分类号: | G06F16/683;G06F16/61;G06F16/33;G06F16/951 |
代理公司: | 广州市律帆知识产权代理事务所(普通合伙) 44614 | 代理人: | 余永文 |
地址: | 510000 广东省广州市海*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 歌曲 文件 歌词 匹配 方法 装置 | ||
本申请涉及一种歌曲文件的歌词匹配方法、装置、计算机设备以及计算机可读存储介质,所述方法包括:获取歌曲文件的歌曲信息;根据所述歌曲信息获取所述歌曲文件的第一歌词,并将所述第一歌词与所述歌曲文件进行匹配;利用语音识别模型对所述歌曲文件进行歌词识别得到第二歌词,并将所述第二歌词与所述歌曲文件进行匹配;利用所述第二歌词的结构信息及所述第一歌词的歌词内容进行修正得到歌词文件;该技术方案,利用了第一歌词的歌词内容结合第二歌词的结构信息,多方联合修正从而可以确保歌词与声音的精准对应和歌词内容的准确性,特别适合于用户自编歌曲的歌词匹配,提升了用户应用体验。
技术领域
本申请涉及音乐处理技术领域,尤其是一种歌曲文件的歌词匹配方法、装置、计算机设备以及计算机可读存储介质。
背景技术
随着人们对演奏或演唱的体验要求不断提升,用户不再只要求听觉上的演奏,更希望可以有视觉上的体验,个性化的歌词展示形式已经成为用户的新追求,而实现这种歌词展示的基础是歌词的准确性,即歌词与歌曲声音需要更加精准的匹配。
目前,在制作、播放歌曲时,将歌词匹配到歌曲上,通常是利用预先制作好的歌词文本来进行添加,另外,也有一些技术是通过语音识别方式实现;对于预先制作方式,由于每首歌都需要进行专业人员去匹配,专业性要求较高,普通用户无法使用来自编个性化歌曲;而采用语音识别方式中,语音识别识别率、精准率是关键因素,由于要保证足够的语音识别精准度,其相应技术成本是非常高高的,也无法在普通用户中推广使用;当然也有些是通过其他网络途径获得歌词。
然而,从现有有技术方案来看,在将歌词匹配到歌曲文件时,难以兼顾歌词与声音的精准对应和歌词内容的准确性,无法确保歌词输出的准确性。
发明内容
针对于上述技术缺陷之一,本申请提供一种歌曲文件的歌词匹配方法、装置、计算机设备以及计算机可读存储介质,可以实现歌词与声音的精准对应和歌词内容的准确性,提高歌词文件输出准确率。
一种歌曲文件的歌词匹配方法,包括:
获取歌曲文件的歌曲信息;
根据所述歌曲信息获取所述歌曲文件的第一歌词,并将所述第一歌词与所述歌曲文件进行匹配;
利用语音识别模型对所述歌曲文件进行歌词识别得到第二歌词,并将所述第二歌词与所述歌曲文件进行匹配;
利用所述第二歌词的结构信息及所述第一歌词的歌词内容进行修正得到歌词文件。
在一个实施例中,所述根据所述歌曲信息获取所述歌曲文件的第一歌词,包括:
根据所述歌曲信息在歌曲库中进行搜索该歌曲文件对应的歌曲数据ID,并根据所述歌曲数据ID读取对应的歌曲数据;其中,所述歌曲数据包括歌曲文件及其第一歌词;
当在所述歌曲库中没有对应的歌曲数据ID时,启用网络爬取方式从公开网站上爬取所述歌曲文件的多份歌词信息,获得第一歌词。
在一个实施例中,所述歌曲库采用M阶B+树结构来存储歌曲数据;其中,所述歌曲数据对应在树结构中记录为歌曲数据ID;采用B+树层级化搜索算法在歌曲库中进行搜索该歌曲文件对应的歌曲数据ID。
在一个实施例中,所述启用网络爬取方式从公开网站上爬取所述歌曲文件的歌词信息,包括:
安装python程序对应的爬虫库;
在公开网站的源代码处寻找对应的URL,并解析该源码获得所述歌曲文件对应的歌曲名及其歌曲ID;
根据所述歌曲名及其歌曲ID并通过网站接口实现对应歌曲文件的歌词数据爬取;
对所述歌词数据中的非歌词信息进行数据清理后保存为纯文本的歌词信息,获得第一歌词。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于广州艾美网络科技有限公司,未经广州艾美网络科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202111287359.8/2.html,转载请声明来源钻瓜专利网。