[发明专利]一种声像联合的监控方法及系统无效

申请号：	200810231607.5	申请日：	2008-10-07
公开（公告）号：	CN101364408A	公开（公告）日：	2009-02-11
发明（设计）人：	陈建峰	申请（专利权）人：	西安成峰科技有限公司
主分类号：	G10L15/02	分类号：	G10L15/02;G10L15/06;G10L15/08;H04N7/18
代理公司：	西安新思维专利商标事务所有限公司	代理人：	黄秦芳
地址：	710075陕西省西***	国省代码：	陕西;61
权利要求书：	查看更多	说明书：	查看更多
摘要：	本发明属于一种工业环境监控技术，特别地，涉及一种声像联合的监控方法及系统。本发明为克服现有技术存在的仅使用视频监控值班人员容易疲劳，难以辨认有安全隐患的地点，同时视频监控受到功能、视角的限制难以奏效，导致不能及时发现隐患，贻误救援时机的问题，现提出的解决方案是：一种声像联合的监控方法，是采用声音信号与视频信号同时使用来进行环境监测，利用声音信号的识别结果引导值班人员有选择地观察视频窗口，声音信号的处理首先包括特征提取、模型训练、声音分类、在线学习这些步骤，最后为危险等级评估步骤：一、特征提取步骤；二、模型训练步骤；三、声音分类步骤；四、在线学习步骤；五、危险等级评估步骤。
搜索关键词：	一种声像联合监控方法系统
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【主权项】：

1、一种声像联合的监控方法，是采用声音信号与视频信号同时使用来进行环境监测，利用声音信号的识别结果引导值班人员有选择地观察视频窗口，帮助值班人员对重点、嫌疑区域进行重点观测；声音信号的处理首先包括特征提取、模型训练、声音分类、在线学习这些步骤，最后为危险等级评估步骤：一、特征提取步骤：(a)短时特征：选取MFCC的阶数为L时，特征向量可表示为，M＝[c1，c2，Λ，cL](b)全局特征：提取以下的特征，它们各自的数学定义如下，设待处理的声音单元被分为N个帧，P＝(p1，p2，Λ，pk)是各个帧的基频：其中k为本段数据中存在基频的帧数。1)基频的均值：

w_{1} = \frac{1}{k} Σ_{l = 1}^{k} p_{l}

2)基频变化率：w2＝max(p2-p1，p3-p2，Λ，pk-pk-1)3)基频的标准离差：

w_{3} = \frac{1}{k} \sqrt{Σ_{l = 1}^{k} {(p_{l} - w_{1})}^{2}}

4)含基频声音所占比例：

w_{4} = \frac{k}{N}

5)最长含基音声音长度：w5(单位是帧)6)声音平均能量：

w_{6} = \frac{1}{N} Σ_{l = 1}^{N} E_{l},

其中Ei(i＝1，2，…，N)是第i帧的声音能量。7)声音强度的标准离差：

w_{7} = \frac{1}{N} \sqrt{Σ_{l = 1}^{N} {(E_{l} - \overline{E})}^{2}},

其中E是平均声音能量。8)第一共振峰w8(频率)9)第二共振峰w9(频率)10)语速

w_{10} = \frac{t_{1}}{n},

特指在声音为语音时，说话人的语速。主要用于辨别是否发生争吵事件。t1指每句话的持续时间，其中包含音节间的停顿，n指的是发音的音节数。这10个特征组成一个特征向量如下：W＝[w1，w2，Λ，w10]二、模型训练步骤：针对以上特征，对所获取的各类声音的样本进行计算和特征参数统计，为每个类别的声音建立模型，采用高斯混合模型进行训练；三、声音分类步骤：分类器可以选择统计分类中的一些基本的方法，如高斯混合模型、贝叶斯分类器，K近邻分类器，或者神经网络类中的支持向量机分类器等。四、在线学习步骤：对声音模型和声音特征在分类器中各个参数的优化和适应。五、危险等级评估步骤：确定了声音的种类后，再将危害性声音的程度确定出来，即根据声音的类型，与定义好的危险系数权值对应后获得待测声音的危险等级。

下载完整专利技术内容需要扣除积分，VIP会员可以免费下载。

免登录下载普通用户下载升级VIP会员，免费下载

该专利技术资料仅供研究查看技术是否侵权等信息，商用须获得专利权人授权。该专利全部权利属于西安成峰科技有限公司，未经西安成峰科技有限公司许可，擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作，请联系【客服】

本文链接：http://www.vipzhuanli.com/patent/200810231607.5/，转载请声明来源钻瓜专利网。

上一篇：烷基咪唑酮的（甲基）丙烯酸酯基组合物
下一篇：纳米氨基酸络合物制备新工艺

同类专利

专利分类

G 物理

G10 乐器；声学
G10L 语音分析或合成；语音识别；音频分析或处理
G10L15-00 语音识别
G10L15-02 .语音识别的特征提取；识别单位的选择
G10L15-04 .分段或字极限检测
G10L15-06 .创建基准模板；训练语音识别系统，例如对说话者声音特征的适应
G10L15-08 .语音分类或检索
G10L15-20 .专门适用于不利环境

免登录下载普通用户下载升级VIP会员，免费下载

[发明专利]一种声像联合的监控方法及系统无效

专利文献下载