[发明专利]一种音频文件的旋律提取方法及旋律识别系统有效

申请号：	201010567156.X	申请日：	2010-11-30
公开（公告）号：	CN102063904A	公开（公告）日：	2011-05-18
发明（设计）人：	谢振宇	申请（专利权）人：	广州酷狗计算机科技有限公司
主分类号：	G10L15/28	分类号：	G10L15/28;G10L15/02;G10L17/00
代理公司：	广州华进联合专利商标代理有限公司 44224	代理人：	王茹;曾旻辉
地址：	510665 广东省广***	国省代码：	广东;44
权利要求书：	查看更多	说明书：	查看更多
摘要：
搜索关键词：	一种音频文件旋律提取方法识别系统
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【说明书】：

技术领域

本发明涉及一种音频文件的旋律提取方法，以及一种音频文件的旋律识别系统。

背景技术

传统的音频播放器或者音乐下载器中，常常通过与音频文件绑定的身份数据信息来识别音频文件，这部分身份数据信息通常设置在音频文件的开头或末尾的若干字节内，称为ID3信息，所述ID3信息常常记载了所述音频文件的歌手、标题、专辑名称、年代、风格等信息。播放器或者下载器在音频文件中提取这部分身份数据信息，然后显示给用户查看。

然而，如今通过相关的软件可以轻易地修改音频文件中的所述身份数据信息，在网络上传播的音频文件，所述身份数据信息在多次转载的过程中可能会被不同的用户修改甚至删除，导致所述音频文件的身份数据信息与实际不符甚至无法识别，给用户使用带来不便。

发明内容

本发明要解决的技术问题是提供一种较准确的音频文件的旋律提取方法，其不依赖于音频文件中绑定的身份数据信息，能够准确地识别音频文件的身份。

一种音频文件的旋律提取方法，包括以下步骤：保存预先建立的标签库，其中，所述标签库中预先保存多个音频文件的第一数字标签以及所述音频文件的身份数据信息；在一个音频文件中截取若干个音频片段，分别提取所述若干个音频片段的音频特征生成所述音频文件的第二数字标签；根据所述第二数字标签查找所述标签库，获取与所述第二数字标签相匹配的第一数字标签及其对应的身份数据信息；将所述身份数据信息与所述音频文件相匹配。

本发明要解决的技术问题还在于提供一种较准确的音频文件的旋律识别系统。

所述音频文件的旋律识别系统包括客户端和服务器，所述客户端用于在一个音频文件中截取若干个音频片段；分别提取所述若干个音频片段的音频特征，生成所述音频文件的第二数字标签，然后将所述第二数字标签发送至所述服务器；接收所述服务器发送的身份数据信息，将所述身份数据信息与所述音频文件相匹配。所述服务器用于保存预先建立的标签库，其中，所述标签库中预先保存多个音频文件的第一数字标签以及所述音频文件的身份数据信息；接收所述客户端发送的第二数字标签，根据所述第二数字标签查找所述标签库，获取与所述第二数字标签相匹配的第一数字标签及其对应的身份数据信息，并将所述身份数据信息发送至所述客户端。

与现有技术相比较，本发明的音频文件的旋律提取方法及旋律识别系统中，对一个音频文件截取音频片段，提取所述音频片段的特征生成所述第二数字标签，查找所述标签库，获取与所述第二数字标签对应的音频文件身份数据信息并匹配至对应的音频文件。因为在识别音频文件的过程中不依赖于所述音频文件上附带的身份数据信息，而是直接根据其本身的音频特征来识别所述音频文件，因为每个所述音频文件都有其唯一的音频特征，所以本发明的音频文件的旋律提取方法及旋律识别系统能够准确地识别各个不同的音频文件，不会因为在转载过程中身份数据信息的修改而导致无法识别。并且，由于不是对整个音频文件生成所述第二数字标签，而是截取音频文件中的音频片段来生成所述第二数字标签，所以，所述第二数字标签的数据量比较小；通过截取数据片段的过程筛选出非静音的音频片段，还可以在生成所述第二数字标签时过滤掉连续静音的音频片段，进一步减小所述数字标签的数据量，因此可以加快在所述标签库中查找数字标签的速度，从而提高整个音频文件识别过程的效率；另外，还可以使所述标签库中储存更多的数字标签，增强对音频文件的识别能力。

附图说明

图1是本发明音频文件的旋律提取方法的步骤流程图；

图2是本发明音频文件的旋律识别系统的结构示意图；

图3是本发明音频文件的旋律识别系统中客户端的结构示意图。

具体实施方式

请参阅图1，图1是本发明音频文件的旋律提取方法的步骤流程图。

所述音频文件的旋律提取方法包括以下步骤：

在步骤S101，保存预先建立的标签库。

其中，所述标签库中预先保存多个音频文件的第一数字标签以及所述音频文件的身份数据信息。

在本步骤中，可以先对音频库中的音频文件进行音频片段的截取，然后根据所述音频片段的音频特征生成所述音频库中所有音频文件的第一数字标签，然后将所述音频文件标准的身份数据信息与所述第一数字标签建立一一对应的关系，建立所述标签库。所述第一数字标签根据所述音频文件的音频特征生成，其生成步骤可与步骤S102中所述第二数字标签的生成方法相同。

下载完整专利技术内容需要扣除积分，VIP会员可以免费下载。

免登录下载普通用户下载升级VIP会员，免费下载

该专利技术资料仅供研究查看技术是否侵权等信息，商用须获得专利权人授权。该专利全部权利属于广州酷狗计算机科技有限公司，未经广州酷狗计算机科技有限公司许可，擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作，请联系【客服】

本文链接：http://www.vipzhuanli.com/pat/books/201010567156.X/2.html，转载请声明来源钻瓜专利网。

同类专利

专利分类

G 物理

G10 乐器；声学
G10L 语音分析或合成；语音识别；音频分析或处理
G10L15-00 语音识别
G10L15-02 .语音识别的特征提取；识别单位的选择
G10L15-04 .分段或字极限检测
G10L15-06 .创建基准模板；训练语音识别系统，例如对说话者声音特征的适应
G10L15-08 .语音分类或检索
G10L15-20 .专门适用于不利环境

免登录下载普通用户下载升级VIP会员，免费下载

[发明专利]一种音频文件的旋律提取方法及旋律识别系统有效

专利文献下载