[发明专利]用于快速音频搜索的方法和设备有效
申请号: | 201210021261.2 | 申请日: | 2006-07-03 |
公开(公告)号: | CN102456077A | 公开(公告)日: | 2012-05-16 |
发明(设计)人: | Y·陈 | 申请(专利权)人: | 英特尔公司 |
主分类号: | G06F17/30 | 分类号: | G06F17/30 |
代理公司: | 中国专利代理(香港)有限公司 72001 | 代理人: | 朱海煜 |
地址: | 美国加利*** | 国省代码: | 美国;US |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 用于 快速 音频 搜索 方法 设备 | ||
1.一种用于在多处理器系统中为目标音频剪辑搜索音频数据库的方法,包括:
将所述音频数据库划分成多个组;
为所述目标音频剪辑建立模型;
调度所述多个组到所述多处理器系统中的多个处理器;以及
由所述多个处理器并行处理所述已调度的组以搜寻所述目标音频剪辑,包括将所述已调度的组的每个组划分成至少一个段,并且对于每个段:
(a)为所述段建立模型;
(b)计算在所述段的所述模型与所述目标音频剪辑的所述模型之间的距离;
(c)如果所述距离满足预定阈值,则确定所述段匹配所述目标音频剪辑;以及
(d)如果所述距离不满足预定阈值,则跳过处理一定数量的段,段的所述数量取决于所述距离的值。
2.如权利要求1所述的方法,其中划分所述音频数据库包括为所述多个组的每个组确定大小,确定所述大小以减少所述多个组的并行处理中的负载失衡和所述多个组中的重叠计算的量。
3.如权利要求1所述的方法,其中建立所述目标音频剪辑的所述模型包括从所述目标音频剪辑提取特征向量序列(FVS),并为所述FVS建模。
4.如权利要求1所述的方法,其中所述至少一个段的每一个在时间上具有与所述目标音频剪辑的长度相同的长度。
5.一种用于在多处理器系统中为目标音频剪辑搜索音频数据库的方法,包括:
将所述音频数据库划分成多个组;
为所述目标音频剪辑建立模型;
调度所述多个组到所述多处理器系统中的多个处理器;
将所述已调度的组的每个组划分成至少一个段;
由所述多个处理器并行处理所述已调度的组以搜寻所述目标音频剪辑;
其中如果在音频流中有不止一个段,则每个段与紧接在该段前的段部分地重叠。
6.如权利要求5所述的方法,其中对于每个段,所述方法包括:
(a)为所述段提取特征向量序列(“FVS”),以及
(b)为所述段的所述FVS建模,以确定所述段的模型;
(c)计算在所述段的所述模型与所述目标音频剪辑的所述模型之间的距离;
(d)如果所述距离满足预定阈值,则确定所述段匹配所述目标音频剪辑;以及
(e)如果所述距离不满足预定阈值,则跳过处理一定数量的段,段的所述数量取决于所述距离的值。
7.一种包括含有指令的机器可读介质的物品,所述指令在由多处理器平台运行时促使所述多处理器平台执行操作,包括:
将音频数据库划分成多个组;
为目标音频剪辑建立模型;
调度所述多个组到所述多处理器系统中的多个处理器;以及
由所述多个处理器并行处理所述已调度的组以搜寻所述目标音频剪辑,包括将所述已调度的组的每个组划分成至少一个段,并且对于每个段:
(a)为所述段建立模型;
(b)计算在所述段的所述模型与所述目标音频剪辑的所述模型之间的距离;
(c)如果所述距离满足预定阈值,则确定所述段匹配所述目标音频剪辑;以及
(d)如果所述距离不满足预定阈值,则跳过处理一定数量的段,段的所述数量取决于所述距离的值。
8.如权利要求7所述的物品,其中划分所述音频数据库包括为所述多个组的每个组确定大小,确定所述大小以减少所述多个组的并行处理中的负载失衡和所述多个组中的重叠计算的量。
9.如权利要求7所述的物品,其中为所述目标音频剪辑建立模型包括从所述目标音频剪辑提取特征向量序列(FVS),并基于多个高斯分量对来自所述目标音频剪辑的所述FVS进行建模。
10.如权利要求9所述的物品,其中对来自所述目标音频剪辑的所述FVS进行建模包括为所述多个高斯分量的每个分量估计混合加权。
11.如权利要求7所述的物品,其中所述至少一个段的每一个在时间上具有与所述目标音频剪辑的长度相同的长度。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于英特尔公司,未经英特尔公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201210021261.2/1.html,转载请声明来源钻瓜专利网。