[发明专利]音频指纹的生成方法、装置及存储介质有效
申请号: | 201810841791.9 | 申请日: | 2018-07-27 |
公开(公告)号: | CN109102811B | 公开(公告)日: | 2021-03-30 |
发明(设计)人: | 肖纯智 | 申请(专利权)人: | 广州酷狗计算机科技有限公司 |
主分类号: | G10L17/00 | 分类号: | G10L17/00;G10L17/02;G10L25/18 |
代理公司: | 北京三高永信知识产权代理有限责任公司 11138 | 代理人: | 郭晶 |
地址: | 510660 广东省广州*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明公开了一种音频指纹的生成方法、装置及存储介质,属于多媒体技术领域。所述方法包括:将目标音频划分为M帧音频,确定M帧音频每帧音频的N个频域能量,对于M帧音频中任一帧音频A,根据音频A的N个频域能量,确定音频A的指纹序列,得到与M帧音频一一对应的M个指纹序列。也即是,在本发明实施例中,每帧音频对应一个指纹序列,且每帧音频的指纹序列仅仅与该帧音频的N个频域能量相关,与相邻帧的音频的频域能量没有关系,这样的话,如果目标音频中某一帧音频中混入杂音,只会影响该帧音频的指纹序列,对其他的指纹序列不会产生影响,提高了音频指纹的抗干扰性。 | ||
搜索关键词: | 音频 指纹 生成 方法 装置 存储 介质 | ||
【主权项】:
1.一种音频指纹的生成方法,其特征在于,所述方法包括:将需要确定音频指纹的目标音频划分为M帧音频,M为大于或等于1的正整数;确定所述M帧音频中每帧音频的N个频域能量,每个频域能量对应一个频率区间,N为大于或等于1的正整数;对于所述M帧音频中任一帧音频A,根据所述音频A的N个频域能量,确定所述音频A的指纹序列,得到与所述M帧音频一一对应的M个指纹序列,并将所述M个指纹序列作为所述目标音频的音频指纹。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于广州酷狗计算机科技有限公司,未经广州酷狗计算机科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201810841791.9/,转载请声明来源钻瓜专利网。
- 上一篇:声纹识别方法和装置
- 下一篇:一种声纹识别方法、系统及电子设备