[发明专利]一种声像联合的监控方法及系统无效
申请号: | 200810231607.5 | 申请日: | 2008-10-07 |
公开(公告)号: | CN101364408A | 公开(公告)日: | 2009-02-11 |
发明(设计)人: | 陈建峰 | 申请(专利权)人: | 西安成峰科技有限公司 |
主分类号: | G10L15/02 | 分类号: | G10L15/02;G10L15/06;G10L15/08;H04N7/18 |
代理公司: | 西安新思维专利商标事务所有限公司 | 代理人: | 黄秦芳 |
地址: | 710075陕西省西*** | 国省代码: | 陕西;61 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明属于一种工业环境监控技术,特别地,涉及一种声像联合的监控方法及系统。本发明为克服现有技术存在的仅使用视频监控值班人员容易疲劳,难以辨认有安全隐患的地点,同时视频监控受到功能、视角的限制难以奏效,导致不能及时发现隐患,贻误救援时机的问题,现提出的解决方案是:一种声像联合的监控方法,是采用声音信号与视频信号同时使用来进行环境监测,利用声音信号的识别结果引导值班人员有选择地观察视频窗口,声音信号的处理首先包括特征提取、模型训练、声音分类、在线学习这些步骤,最后为危险等级评估步骤:一、特征提取步骤;二、模型训练步骤;三、声音分类步骤;四、在线学习步骤;五、危险等级评估步骤。 | ||
搜索关键词: | 一种 声像 联合 监控 方法 系统 | ||
【主权项】:
1、一种声像联合的监控方法,是采用声音信号与视频信号同时使用来进行环境监测,利用声音信号的识别结果引导值班人员有选择地观察视频窗口,帮助值班人员对重点、嫌疑区域进行重点观测;声音信号的处理首先包括特征提取、模型训练、声音分类、在线学习这些步骤,最后为危险等级评估步骤:一、特征提取步骤:(a)短时特征:选取MFCC的阶数为L时,特征向量可表示为,M=[c1,c2,Λ,cL](b)全局特征:提取以下的特征,它们各自的数学定义如下,设待处理的声音单元被分为N个帧,P=(p1,p2,Λ,pk)是各个帧的基频:其中k为本段数据中存在基频的帧数。1)基频的均值:2)基频变化率:w2=max(p2-p1,p3-p2,Λ,pk-pk-1)3)基频的标准离差:4)含基频声音所占比例:5)最长含基音声音长度:w5(单位是帧)6)声音平均能量:其中Ei(i=1,2,…,N)是第i帧的声音能量。7)声音强度的标准离差:其中E是平均声音能量。8)第一共振峰w8(频率)9)第二共振峰w9(频率)10)语速特指在声音为语音时,说话人的语速。主要用于辨别是否发生争吵事件。t1指每句话的持续时间,其中包含音节间的停顿,n指的是发音的音节数。这10个特征组成一个特征向量如下:W=[w1,w2,Λ,w10]二、模型训练步骤:针对以上特征,对所获取的各类声音的样本进行计算和特征参数统计,为每个类别的声音建立模型,采用高斯混合模型进行训练;三、声音分类步骤:分类器可以选择统计分类中的一些基本的方法,如高斯混合模型、贝叶斯分类器,K近邻分类器,或者神经网络类中的支持向量机分类器等。四、在线学习步骤:对声音模型和声音特征在分类器中各个参数的优化和适应。五、危险等级评估步骤:确定了声音的种类后,再将危害性声音的程度确定出来,即根据声音的类型,与定义好的危险系数权值对应后获得待测声音的危险等级。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于西安成峰科技有限公司,未经西安成峰科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/200810231607.5/,转载请声明来源钻瓜专利网。
- 上一篇:烷基咪唑酮的(甲基)丙烯酸酯基组合物
- 下一篇:纳米氨基酸络合物制备新工艺