[发明专利]一种声像联合的监控方法及系统无效
申请号: | 200810231607.5 | 申请日: | 2008-10-07 |
公开(公告)号: | CN101364408A | 公开(公告)日: | 2009-02-11 |
发明(设计)人: | 陈建峰 | 申请(专利权)人: | 西安成峰科技有限公司 |
主分类号: | G10L15/02 | 分类号: | G10L15/02;G10L15/06;G10L15/08;H04N7/18 |
代理公司: | 西安新思维专利商标事务所有限公司 | 代理人: | 黄秦芳 |
地址: | 710075陕西省西*** | 国省代码: | 陕西;61 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 声像 联合 监控 方法 系统 | ||
1、一种声像联合的监控方法,是采用声音信号与视频信号同时使用来进行环境监测,利用声音信号的识别结果引导值班人员有选择地观察视频窗口,帮助值班人员对重点、嫌疑区域进行重点观测;声音信号的处理首先包括特征提取、模型训练、声音分类、在线学习这些步骤,最后为危险等级评估步骤:
一、特征提取步骤:
(a)短时特征:选取MFCC的阶数为L时,特征向量可表示为,
M=[c1,c2,Λ,cL]
(b)全局特征:提取以下的特征,它们各自的数学定义如下,
设待处理的声音单元被分为N个帧,P=(p1,p2,Λ,pk)是各个帧的基频:其中k为本段数据中存在基频的帧数。
1)基频的均值:
2)基频变化率:w2=max(p2-p1,p3-p2,Λ,pk-pk-1)
3)基频的标准离差:
4)含基频声音所占比例:
5)最长含基音声音长度:w5(单位是帧)
6)声音平均能量:
7)声音强度的标准离差:
8)第一共振峰w8(频率)
9)第二共振峰w9(频率)
10)语速
这10个特征组成一个特征向量如下:
W=[w1,w2,Λ,w10]
二、模型训练步骤:
针对以上特征,对所获取的各类声音的样本进行计算和特征参数统计,为每个类别的声音建立模型,采用高斯混合模型进行训练;
三、声音分类步骤:
分类器可以选择统计分类中的一些基本的方法,如高斯混合模型、贝叶斯分类器,K近邻分类器,或者神经网络类中的支持向量机分类器等。
四、在线学习步骤:对声音模型和声音特征在分类器中各个参数的优化和适应。
五、危险等级评估步骤:
确定了声音的种类后,再将危害性声音的程度确定出来,即根据声音的类型,与定义好的危险系数权值对应后获得待测声音的危险等级。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于西安成峰科技有限公司,未经西安成峰科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/200810231607.5/1.html,转载请声明来源钻瓜专利网。
- 上一篇:烷基咪唑酮的(甲基)丙烯酸酯基组合物
- 下一篇:纳米氨基酸络合物制备新工艺