[发明专利]一种音频流媒体的跟踪方法及系统有效

申请号：	201210477360.1	申请日：	2012-11-22
公开（公告）号：	CN103021440A	公开（公告）日：	2013-04-03
发明（设计）人：	易立夫;张云;李深远;陈剑锋;马斌	申请（专利权）人：	腾讯科技（深圳）有限公司
主分类号：	G11B27/11	分类号：	G11B27/11;G06F17/30
代理公司：	深圳翼盛智成知识产权事务所(普通合伙) 44300	代理人：	欧阳启明
地址：	518000 广东省深***	国省代码：	广东;44
权利要求书：	查看更多	说明书：	查看更多
摘要：
搜索关键词：	一种音频流媒体跟踪方法系统
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【说明书】：

【技术领域】

本发明涉及音频处理技术领域，特别涉及一种音频流媒体的跟踪方法及系统。

【背景技术】

目前，用户在收听流媒体时（例如电台歌曲），由于播放一首完整的流媒体需要持续一段时间（例如3到4分钟），如何在播放过程中持续跟踪流媒体以实时显示准确的流媒体信息尤为重要。现有技术中，可以采用音频指纹（fingerprint）技术对流媒体进行跟踪。音频指纹是指可以代表一段音乐重要声学特征的基于内容的紧致的数字签名。音频指纹技术通常包括两个部分：即一个计算听觉重要特征的指纹提取算法和一个在指纹数据库中进行有效搜索的指纹比对算法。当要识别一段未知音频时，首先按照指纹提取算法计算其音频特征，然后和指纹数据库中存储的大量音频指纹按照指纹比对算法进行比对，识别出对应的音频。一个有效的音频指纹技术能够在数据库中正确识别出可能经受各种信号处理的、失真的未知音频的原始版本。

音频指纹系统的目标是通过接收音频信号并利用预先构建的音频指纹数据库搜索对应的音频来识别预定的音频。根据应用领域，音频指纹系统已经用于广播监视器、CF识别、和文件过滤。为了在所述应用领域中有效地使用音频指纹系统，甚至在各种失真情况下，也需要高识别率和快的搜索速度。具体地，为了在P2P或UCC领域中过滤文件，需要迅速且准确地搜索由其每一个具有自己的版权的几十万个音频文件形成的音频指纹数据。对于在基于大容量音频指纹数据库进行操作的广播监视和文件过滤领域中的实时处理，识别速度是最重要因素之一。

现有技术中采用音频指纹（fingerprint）技术对流媒体进行跟踪包括：首先对音频片段的音频信号进行分帧后，基于起始点检测算法确定关键帧，提取关键帧的音频指纹，将关键帧的音频指纹和流媒体信息对应存储到哈希表中，用户输入音频片段进行音频指纹检索，基于该音频片段的音频信号得到音频指纹，再根据该音频指纹从所述哈希表中匹配对应的流媒体信息，得到包含所述音频片段的流媒体信息，实现流媒体的识别，并需要在流媒体播放过程中持续不断的进行上述音频指纹匹配直到流媒体播放结束；上述流媒体跟踪方式在已经识别出流媒体之后，仍然持续进行音频指纹匹配这种费时费力的计算，对计算资源和内存资源都是一种巨大的消耗，通常检索的反应时间会比较长（比如1秒）；同时，持续进行这种匹配计算，如果前后两次匹配的结果稍有差别（由于存在重复流媒体但流媒体名称和歌手名小有差异的情况），还会增加流媒体识别的复杂度（比如结果排序）。

故，有必要提出一种新的技术方案，以解决上述流媒体跟踪方式在已经识别出流媒体之后仍然持续进行音频指纹匹配浪费计算资源和内存资源且增加流媒体识别复杂度的技术问题。

【发明内容】

本发明的一个目的在于提供一种流媒体跟踪方法及系统，旨在解决现有技术中的流媒体跟踪方式在已经识别出流媒体之后仍然持续进行音频指纹匹配浪费计算资源和内存资源且增加流媒体识别复杂度的技术问题。

为达到上述目的，本发明提供了一种音频流媒体的跟踪方法，包括：

对播放的音频流按照时间间隔进行切分，通过音频指纹得到当前音频流片段的匹配流媒体信息；

判断下一个音频流片段与匹配流媒体信息的匹配度是否大于预设阀值，如果下一个音频流片段与匹配流媒体信息的匹配度小于预设阀值，重新匹配下一个音频流片段的流媒体信息；如果下一个音频流片段与匹配流媒体信息的匹配度大于预设阀值，执行下一步骤；

设置下一个音频流片段的匹配流媒体信息为所述当前音频流片段的匹配流媒体信息。

在上述音频流媒体的跟踪方法中，所述音频指纹为代表音频流媒体重要声学特征的基于内容的数字签名。

在上述音频流媒体的跟踪方法中，所述通过音频指纹得到当前音频流片段的匹配流媒体信息步骤包括：

对当前音频流片段的音频信号进行分帧处理，得到分帧频谱图；

通过起始点检测算法检测各分帧频谱图中的关键帧，保留关键帧的分帧频谱图；

得到所述关键帧的音频指纹，根据关键帧的音频指纹对应的流媒体信息计算得到包含当前音频流片段的流媒体信息并返回匹配结果。