[发明专利]一种音频文件的旋律提取方法及旋律识别系统有效
申请号: | 201010567156.X | 申请日: | 2010-11-30 |
公开(公告)号: | CN102063904A | 公开(公告)日: | 2011-05-18 |
发明(设计)人: | 谢振宇 | 申请(专利权)人: | 广州酷狗计算机科技有限公司 |
主分类号: | G10L15/28 | 分类号: | G10L15/28;G10L15/02;G10L17/00 |
代理公司: | 广州华进联合专利商标代理有限公司 44224 | 代理人: | 王茹;曾旻辉 |
地址: | 510665 广东省广*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 音频文件 旋律 提取 方法 识别 系统 | ||
1.一种音频文件的旋律提取方法,其特征在于包括以下步骤:
保存预先建立的标签库,其中,所述标签库中预先保存多个音频文件的第一数字标签以及所述音频文件的身份数据信息;
在一个音频文件中截取若干个音频片段,分别提取所述若干个音频片段的音频特征生成所述音频文件的第二数字标签;
根据所述第二数字标签查找所述标签库,获取与所述第二数字标签相匹配的第一数字标签及其对应的身份数据信息;
将所述身份数据信息与所述音频文件相匹配。
2.如权利要求1所述的音频文件的旋律提取方法,其特征在于,查找所述标签库,获取与所述第二数字标签相匹配的第一数字标签及其对应的身份数据信息的步骤包括:
在预设的误差范围内,查找与所述第二数字标签相似度最高的所述第一数字标签,获取所述第一数字标签及其对应的音频文件身份信息。
3.如权利要求1所述的音频文件的旋律提取方法,其特征在于,在一个音频文件中截取若干个音频片段的步骤包括:
将所述音频文件分成多个帧,帧与帧之间互相重叠,将每一帧作为一个所述音频片段。
4.如权利要求1、2或者3所述的音频文件的旋律提取方法,其特征在于,分别提取所述若干个音频片段的音频特征生成所述音频文件的第二数字标签的步骤包括:
检测所述音频片段的下述各种音频特征参数中的一种或多种,通过采样、量化和编码生成所述第二数字标签:
响度、亮度、音调、短时平均能量、过零率、能量谱、Mel倒谱系数以及线性预测系数。
5.如权利要求4所述的音频文件的旋律提取方法,其特征在于:在检测所述音频片段的过零率时,预先设定一门限值,如果在单位时间内样点值改变符号,并且差值的绝对值大于所述门限值,则所述过零率加1。
6.一种音频文件的旋律识别系统,包括客户端和服务器,其特征在于:
所述客户端用于在一个音频文件中截取若干个音频片段;分别提取所述若干个音频片段的音频特征,生成所述音频文件的第二数字标签,然后将所述第二数字标签发送至所述服务器;接收所述服务器发送的身份数据信息,将所述身份数据信息与所述音频文件相匹配;
所述服务器用于保存预先建立的标签库,其中,所述标签库中预先保存多个音频文件的第一数字标签以及所述音频文件的身份数据信息;接收所述客户端发送的第二数字标签,根据所述第二数字标签查找所述标签库,获取与所述第二数字标签相匹配的第一数字标签及其对应的身份数据信息,并将所述身份数据信息发送至所述客户端。
7.如权利要求6所述的音频文件的旋律识别系统,其特征在于:所述服务器在预设的误差范围内,查找与所述第二数字标签相似度最高的所述第一数字标签,获取所述第一数字标签及其对应的音频文件身份信息。
8.如权利要求6所述的音频文件的旋律识别系统,其特征在于:所述客户端将所述音频文件分成多个帧,帧与帧之间互相重叠,将每一帧作为一个所述音频片段。
9.如权利要求6、7或者8所述的音频文件的旋律识别系统,其特征在于:所述客户端检测所述音频片段的下述各种音频特征参数中的一种或多种,通过采样、量化和编码生成所述第二数字标签:
响度、亮度、音调、短时平均能量、过零率、能量谱、Mel倒谱系数以及线性预测系数。
10.如权利要求9所述的音频文件的旋律识别系统,其特征在于:所述客户端在检测所述音频片段的过零率时,预先设定一门限值,如果在单位时间内样点值改变符号,并且差值的绝对值大于所述门限值,则所述过零率加1。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于广州酷狗计算机科技有限公司,未经广州酷狗计算机科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201010567156.X/1.html,转载请声明来源钻瓜专利网。
- 上一篇:热水加热器和供应热水的方法
- 下一篇:显示设备及其控制方法