[发明专利]一种基于旋律识别的多媒体安全过滤方法在审
申请号: | 201210481006.6 | 申请日: | 2012-11-23 |
公开(公告)号: | CN102984147A | 公开(公告)日: | 2013-03-20 |
发明(设计)人: | 王磊;黄伟 | 申请(专利权)人: | 上海吟隆信息科技有限公司 |
主分类号: | H04L29/06 | 分类号: | H04L29/06;G06F17/30 |
代理公司: | 上海宝鼎专利代理有限公司 31222 | 代理人: | 龚峥嵘 |
地址: | 201200 上*** | 国省代码: | 上海;31 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 旋律 识别 多媒体 安全 过滤 方法 | ||
1.一种基于旋律识别的多媒体安全过滤方法,其特征在于,包括如下步骤:
a) 采集非法宣传音频的样本;
b) 提取样本中关键语句的旋律特征,并将其添加到非法语音特征数据库中;
c) 采集上传到网络上的多媒体文件的音频,并对其进行分段;
d) 提取每一分段的旋律特征,并在非法语言特征数据库中查找相似的旋律特征,如找到,则判定该多媒体文件中存在非法宣传片段。
2.如权利要求1所述的基于旋律识别的多媒体安全过滤方法,其特征在于,所述旋律特征为音符片段序列: ,其中,代表音符音高,为音符持续时长,m为音符片段数,i为自然数,。
3.如权利要求2所述的基于旋律识别的多媒体安全过滤方法,其特征在于,所述音符片段序列持续时长为5~15秒。
4.如权利要求2所述的基于旋律识别的多媒体安全过滤方法,其特征在于,所述步骤d)中查找相似的旋律特征包括如下过程:
计算两个旋律特征相似度:
其中,A=,B=为两个待比较相似度的旋律特征,m为旋律特征A的音符片段数,W 为旋律特征A的音符片段的长度,n为旋律特征B的音符片段数,U为旋律特征B的音符片段的长度,为音符到的距离,表示搬移音符的长度;
当两个旋律特征的相似度达到预设阈值则判定两个旋律特征相符。
5.如权利要求4所述的基于旋律识别的多媒体安全过滤方法,其特征在于,所述相似度的预设阈值范围为[0.86,1]。
6.如权利要求2所述的基于旋律识别的多媒体安全过滤方法,其特征在于,所述步骤d)中查找相似的旋律特征包括如下过程:
d1) 对音符片段序列加汉明窗后提取功率谱,然后将功率谱按照梅尔对数频率刻度,划分成若干个子带;
d2) 计算各子带能量,得到各子带能量的分布,将各子带能量进行归一化,得到能量向量;
d3) 将能量向量量化成矢量量化码本中的码字;
d4) 若两个音符片段序列码字相同则判定两个旋律特征相似。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于上海吟隆信息科技有限公司,未经上海吟隆信息科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201210481006.6/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种处理含钡废水的复合除钡剂
- 下一篇:一种含两pprrr闭环子链的并联机构