[发明专利]一种声像联合的监控方法及系统无效

专利信息
申请号: 200810231607.5 申请日: 2008-10-07
公开(公告)号: CN101364408A 公开(公告)日: 2009-02-11
发明(设计)人: 陈建峰 申请(专利权)人: 西安成峰科技有限公司
主分类号: G10L15/02 分类号: G10L15/02;G10L15/06;G10L15/08;H04N7/18
代理公司: 西安新思维专利商标事务所有限公司 代理人: 黄秦芳
地址: 710075陕西省西*** 国省代码: 陕西;61
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 一种 声像 联合 监控 方法 系统
【权利要求书】:

1、一种声像联合的监控方法,是采用声音信号与视频信号同时使用来进行环境监测,利用声音信号的识别结果引导值班人员有选择地观察视频窗口,帮助值班人员对重点、嫌疑区域进行重点观测;声音信号的处理首先包括特征提取、模型训练、声音分类、在线学习这些步骤,最后为危险等级评估步骤:

一、特征提取步骤:

(a)短时特征:选取MFCC的阶数为L时,特征向量可表示为,

M=[c1,c2,Λ,cL]

(b)全局特征:提取以下的特征,它们各自的数学定义如下,

设待处理的声音单元被分为N个帧,P=(p1,p2,Λ,pk)是各个帧的基频:其中k为本段数据中存在基频的帧数。

1)基频的均值:w1=1kΣl=1kpl]]>

2)基频变化率:w2=max(p2-p1,p3-p2,Λ,pk-pk-1)

3)基频的标准离差:w3=1kΣl=1k(pl-w1)2]]>

4)含基频声音所占比例:w4=kN]]>

5)最长含基音声音长度:w5(单位是帧)

6)声音平均能量:w6=1NΣl=1NEl,]]>其中Ei(i=1,2,…,N)是第i帧的声音能量。

7)声音强度的标准离差:w7=1NΣl=1N(El-E)2,]]>其中E是平均声音能量。

8)第一共振峰w8(频率)

9)第二共振峰w9(频率)

10)语速w10=t1n,]]>特指在声音为语音时,说话人的语速。主要用于辨别是否发生争吵事件。t1指每句话的持续时间,其中包含音节间的停顿,n指的是发音的音节数。

这10个特征组成一个特征向量如下:

W=[w1,w2,Λ,w10]

二、模型训练步骤:

针对以上特征,对所获取的各类声音的样本进行计算和特征参数统计,为每个类别的声音建立模型,采用高斯混合模型进行训练;

三、声音分类步骤:

分类器可以选择统计分类中的一些基本的方法,如高斯混合模型、贝叶斯分类器,K近邻分类器,或者神经网络类中的支持向量机分类器等。

四、在线学习步骤:对声音模型和声音特征在分类器中各个参数的优化和适应。

五、危险等级评估步骤:

确定了声音的种类后,再将危害性声音的程度确定出来,即根据声音的类型,与定义好的危险系数权值对应后获得待测声音的危险等级。

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于西安成峰科技有限公司,未经西安成峰科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/200810231607.5/1.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top