[发明专利]一种局部傅里叶变换的音频相似判断方法在审
申请号: | 201711345157.8 | 申请日: | 2017-12-15 |
公开(公告)号: | CN108091346A | 公开(公告)日: | 2018-05-29 |
发明(设计)人: | 王祝 | 申请(专利权)人: | 奕响(大连)科技有限公司 |
主分类号: | G10L25/18 | 分类号: | G10L25/18;G10L25/51;G10L25/27 |
代理公司: | 盘锦大工智讯专利代理事务所(特殊普通合伙) 21244 | 代理人: | 徐淑东;崔雪 |
地址: | 116000 辽宁省大连*** | 国省代码: | 辽宁;21 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 频域 时域 傅里叶变换 散列 分割 频域变换 傅里叶 频域谱 串接 两段 频谱 切割 | ||
本发明公开了一种局部傅里叶变换的音频相似判断方法。第一步,将音频平均切割成64段;第二步,将每个分割后的音频进行傅里叶频域变换,取频域最大的五个分割段,串接组成一个新的频谱;再进一步分割为32段;第三步,分别取频域谱和时域谱中,最大的值组成一个64位数列,先是32位频域值,后是32位时域值;第四步,分别求出32位频域值和32位时域值的均值;第五步,将每位频域值和32位时域与对应的均值做对比;大于或等于为1,小于为0;组成新的64位基于1、0的散列;第六步,比较两段音频的散列,得到位数不同的数量,小于或等于3,则音频相似。
技术领域
本发明涉及音频处理领域,特别涉及一种局部傅里叶变换的音频相似判断方法。
背景技术
音频的相似判断有很多种,在这里就不一一介绍。但是,适合工程使用的,需要具备一个必要的特点:快速;几十万首歌曲,需要几秒种的时间筛选完毕,因此,可以要求其准确率稍差,但是一定要快速;再快速筛选过后,可以再精确筛选或用人工筛选。
傅里叶变换,可以很好的提取音频的特征,而散列之后对比,取汉明距离,可以做到快速的处理数据。二者结合,可以快速的对音频做相似判断。
申请人在同时申请的“一种基于傅里叶变换的音频相似判断方法”和“一种傅里叶变换时域与频域的音频相似判断方法”,均是对整个音频做对比,但是音乐作品侵权往往仅是一小段,而通常这一小段是高潮部分,频域值较大。
发明内容
为了克服上述问题,本发明提供了一种傅里叶变换时域与频域的音频相似判断方法。
第一步,将音频平均切割成64段;
第二步,将每个分割后的音频进行傅里叶频域变换,取频域最大的五个分割段,串接组成一个新的频谱;再进一步分割为32段;
第三步,分别取频域谱和时域谱中,最大的值组成一个64位数列,先是32位频域值,后是32位时域值;
第四步,分别求出32位频域值和32位时域值的均值;
第五步,将每位频域值和32位时域与对应的均值做对比;大于或等于为1,小于为0;组成新的64位基于1、0的散列;
第六步,比较两段音频的散列,得到位数不同的数量,小于或等于3,则音频相似。
有益效果:本发明通过选取频域值较大的五段音频,之后将五段音频的时域与频域的信息做均值的散列,然后做对比,形成基于局部特征的比较方法。
具体实施方式
实施例:
第一步,将音频平均切割成64段;
第二步,将每个分割后的音频进行傅里叶频域变换,取频域最大的五个分割段,串接组成一个新的频谱;再进一步分割为32段;
第三步,分别取频域谱和时域谱中,最大的值组成一个64位数列,先是32位频域值,后是32位时域值;
第四步,分别求出32位频域值和32位时域值的均值;
第五步,将每位频域值和32位时域与对应的均值做对比;大于或等于为1,小于为0;组成新的64位基于1、0的散列;
第六步,比较两段音频的散列,得到位数不同的数量,小于或等于3,则音频相似。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于奕响(大连)科技有限公司,未经奕响(大连)科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201711345157.8/2.html,转载请声明来源钻瓜专利网。