[发明专利]一种基于特征的音乐版权识别方法在审
申请号: | 201711377591.4 | 申请日: | 2017-12-19 |
公开(公告)号: | CN107967922A | 公开(公告)日: | 2018-04-27 |
发明(设计)人: | 尹学渊;王东明;何林 | 申请(专利权)人: | 成都嗨翻屋文化传播有限公司 |
主分类号: | G10L25/45 | 分类号: | G10L25/45;G10L25/54;G10L25/21;G10L25/18;G06F17/30 |
代理公司: | 成都睿道专利代理事务所(普通合伙)51217 | 代理人: | 薛波 |
地址: | 610000 四川省成都市天*** | 国省代码: | 四川;51 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 特征 音乐 版权 识别 方法 | ||
技术领域
本发明属于音频识别技术领域,具体涉及一种基于特征的音乐版权识别方法。
背景技术
随着互联网技术的快速发展,许多原创的数字音频资源都利用网络传播,利用互联网的便利性,人们可以很轻松的下载音频资源,在未经过授权的情况下利用音乐制作音视频文件流传网络。传播过程中就严重涉及到版权问题,随着互联网版权意识的提升,越来越多的人们开始致力于保护原创作品,维护版权。因此,利用软件为对音视频提供识别服务就很有必要。
目前应用多是听歌识曲,根据用户喜欢的音频片段,查找该歌曲。由于视频背景音或节目类音频存在开始和持续时间不确定的因素,因而很少运用该技术对视频背景或节目类音频版权的识别。
Phillips研究人员提出了一种有效的基于频谱多子带特征提取的PRH音频指纹提取算法,但公众能够获得的音频研究文档却不多,该算法存在检索时间随机性、计算量大、对音高敏感的问题。
Echoprint对上万的歌曲识别慢,对噪音较多的文件识别率低。
发明内容
本发明针对现有的音频识别方法中存在识别率低或识别不准确的问题,提供一种基于特征的音乐版权识别方法,有效提高音频文件的识别率,以及准确性,同时解决视频背景或节目类音频音乐出现的时间点和持续时间不确定的问题,识别速度快,为音频版权识别以及鉴别提供有效帮助。
为了实现上述目的,本发明采用的技术方案为:
一种基于特征的音乐版权识别方法,包括获取待识别音频文件,对所述音频文件分片处理,提取音频片段的音频指纹,遍历指纹库的音频指纹,将提取的音频片段的音频指纹与指纹库的音频指纹进行匹配,获得匹配结果;
对所述匹配结果进行优化处理,包括统计出现相同时间差最多的指纹个数是否大于第一预设阈值,如果是,计算出现相同时间差最多的音频指纹持续时间;
判断所述音频指纹持续时间是否大于第二预设阈值,如果是,分析音频指纹对应的时间点的个数;
判断所述时间点的个数是否大于第三预设阈值,如果是,获得每个音频片段的识别结果;
将每个音频片段的识别结果进行合并处理,合并后的连续音频片段的识别结果再按照上述优化处理的方法计算置信度,输出不低于置信度的识别结果,最后根据歌曲标识信息查询歌曲详细信息。
优选地,将提取的音频片段的音频指纹与指纹库的音频指纹进行匹配,匹配的方法包括:
识别服务器从任务队列中获取待识别的音频片段的音频指纹,然后利用这些音频指纹从指纹库中找到包含这些音频指纹的歌曲和对应歌曲的时间点,将待识别的音频指纹对应的时间点减去从指纹库得到歌曲的时间点得到一个时间差,最后统计出现相同时间差和歌曲标识最多的歌曲。
优选地,所述提取音频片段的音频指纹采用的是Shazam算法提取。
优选地,所述的音频指纹持续时间的计算方法包括时间差最多的那一部分指纹获取对应的最大时间点和最小时间点计算出持续时间段,然后乘以Shazam算法指纹提取过程中的每一帧代表的时间,最后计算出实际持续时间。
优选地,所述的合并处理包括首先利用该段索引值乘以每段时间长度计算出每一段的开始时间,然后根据相邻段如果识别到的音频相同且时间差等于分片长度的、或第一段的结果与第二段结果不同但与第三段相同且时间差等于第二段片段长度进行合并。
优选地,所述根据歌曲标识信息查询歌曲详细信息包括利用歌曲指纹对应的时间点计算出歌曲在待识别音频文件的开始时间,并输出包含开始时间、持续时间、歌名的歌曲详细信息。
由于采用了上述技术方案,本发明的有益效果是:
通过在分片或分段式识别方法的基础上,通过分别对指纹个数、指纹持续时间以及时间点的个数依次进行置信度计算以及判断,从而有效提高音频识别的准确性以及识别率;
利用对音视频切片,识别后合并的方式解决视频或包含多段音乐的音频出现音乐时间点和持续时长不确定的问题,为现有的视频背景音乐以及综艺节目类音频音乐识别困难,版权侵犯鉴别困难提供了有效的解决办法。
附图说明
图1为本发明的合并处理示例一示意图。
图2为本发明的合并处理示例二示意图。
具体实施方式
本发明的基于特征的音乐版权识别方法,指纹提取和检索基于Shazam算法。因为用于音视频版权检测,所以待识别的文件不可能存在大量噪音,所以不需要使用CQT来增强算法的抗噪能力,避免了多余计算量节省识别时间。
Shazam算法包括:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于成都嗨翻屋文化传播有限公司,未经成都嗨翻屋文化传播有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201711377591.4/2.html,转载请声明来源钻瓜专利网。
- 上一篇:会议系统的音量调节方法及装置
- 下一篇:一种保证垂直度的激光头读取装置