[发明专利]一种基于改进的MFCC声音特征的工程机械识别方法及识别装置在审

申请号：	201510459030.3	申请日：	2015-07-30
公开（公告）号：	CN105139852A	公开（公告）日：	2015-12-09
发明（设计）人：	曹九稳;赵拓;王瑞荣;黄强;王建中	申请（专利权）人：	浙江图维电力科技有限公司
主分类号：	G10L15/26	分类号：	G10L15/26
代理公司：	北京驰纳智财知识产权代理事务所(普通合伙) 11367	代理人：	孙海波
地址：	311121 浙江省杭州市余***	国省代码：	浙江;33
权利要求书：	查看更多	说明书：	查看更多
摘要：
搜索关键词：	一种基于改进 mfcc 声音特征工程机械识别方法装置
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【说明书】：

技术领域

本发明属于语音识别技术领域，尤其涉及一种基于改进的MFCC声音特征的工程机械识别方法及识别装置。

背景技术

随着我国现代化建设的飞速发展，电力线路所占比重越来越大。对于地下电缆的防护，通常采用埋管、隧道等抗外力强度较高的铺设方式，使其受自然环境影响较小。但电缆在使用中时常受到如：挖掘机、打桩机等工程机械的破坏，电缆供电安全可靠的优势受到严重影响。因此，预防电缆供电不受外力破坏成为了电力系统运行部门亟待解决的问题。

建立智能工程机械识别系统就是解除供电电缆被挖断的困扰，实现由被动得知结果向主动预警防范的战略转变。通过阅读大量文献和实际工地考察，发现在道路开挖的过程中，需要有挖掘机、打桩机、切割机等工程机械的参与完成，因此做好工程机械的检测和识别对及时预警潜在的工程机械作业有着重要的意义。

在现有技术中，已经提出了基于视频图像的运动车辆识别系统，主要是根据车辆的牌照和汽车类型进行识别，但存在的问题是由于受到大雾，光照，部分遮挡等外界情况干扰，使识别效果不是特别理想。一些地区引入分布式光纤传感器来检测振动信号，通过振动信号来识别是否有工程机械正在作业，从而进行实时监控。然而在地铁施工现场的实验中发现，施工现场的复杂性及破坏事件的随机性使振动信号很难采集，对分析结果造成很大影响。

发明内容

针对现有技术中存在的技术问题，本发明提供了一种基于改进的MFCC(Mel频率倒谱系数，MelFrequencyCepstrumCoefficient，MFCC)声音特征的工程机械识别方法及识别装置，这种基于声音特征的工程机械(如：液压冲击锤，挖掘机，切割机，电锤)识别方法及识别装置，可以在城市道路的复杂场景下对声阵列采集设备采集的声音目标进行识别，以判断声音中是否包含有工程机械，从而提高了精度和准确性。

为了实现上述目的，本发明采用如下技术方案。

一种基于改进的MFCC声音特征的工程机械识别方法，包括以下步骤：步骤1，建立声音样本库；步骤2，采集样本声音；步骤3，对样本声音进行分段；步骤4，提取样本特征；步骤5，建立样本特征模型；步骤6，识别目标声音。

优选的是，所述步骤1的建立声音样本库：获取每组样本包含该种工程机械的声音。

在上述任一技术方案中优选的是，所述步骤2的采集样本声音是通过声阵列采集设备在距离工程机械不同距离作业时采集样本，且每组工程机械声音为同一设备在不同采集距离下采集的样本。

在上述任一技术方案中优选的是，所述步骤3的对样本声音进行分段是将每组工程机械的声音按照设定的时间为一时间片段结构分成多个区域。

在上述任一技术方案中优选的是，所述步骤4的提取样本特征是分别从每组样本中所述工程机械声音提取相应的样本特征，来自同一组所述样本的所有样本特征组成一个样本特征集。

在上述任一技术方案中优选的是，所述步骤5的建立样本特征模型是利用同一个所述样本特征集中的特征建立对应的样本特征模型，每个所述样本特征集对应一个样本特征向量模型。

在上述任一技术方案中优选的是，所述步骤6的识别目标声音是将声阵列采集的声音信号通过特征提取与各个所述样本特征模型比对，以判断目标声音的特征是否能够与其中任意一个所述样本特征模型匹配；如果匹配，判断所述声音中包含有工程机械。

在上述任一技术方案中优选的是，所述提取样本特征的步骤具体包括：预处理；加Hamming窗；FFT变化；通过Mel三角滤波器组；求均值和方差；求转置；做FFT变化；通过滤波器组做对数运算；做DCT变化。

在上述任一技术方案中优选的是，所述预处理是对样本声音做预处理x_n＝x_n-kx_n-1,其中k为预加重系数，k介于0.9～1，x_n为样本声音分段后所得的区域。

在上述任一技术方案中优选的是，所述加Hamming窗，设帧长为N，以增加帧左右两端的连续性x'(n)＝x(n)*W(n),其中W(n)＝(1-a)-a*cos(2πn/(N-1))，0≤n≤N-1。

在上述任一技术方案中优选的是，所述FFT变化是：通过FFT变化，0≤k≤N，式中x(n)为输入的语音信号，N表示傅里叶变换的点数，将时域信号转换为频域上的能量分布。

下载完整专利技术内容需要扣除积分，VIP会员可以免费下载。

免登录下载普通用户下载升级VIP会员，免费下载

该专利技术资料仅供研究查看技术是否侵权等信息，商用须获得专利权人授权。该专利全部权利属于浙江图维电力科技有限公司，未经浙江图维电力科技有限公司许可，擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作，请联系【客服】

本文链接：http://www.vipzhuanli.com/pat/books/201510459030.3/2.html，转载请声明来源钻瓜专利网。

同类专利

专利分类

G 物理

G10 乐器；声学
G10L 语音分析或合成；语音识别；音频分析或处理
G10L15-00 语音识别
G10L15-02 .语音识别的特征提取；识别单位的选择
G10L15-04 .分段或字极限检测
G10L15-06 .创建基准模板；训练语音识别系统，例如对说话者声音特征的适应
G10L15-08 .语音分类或检索
G10L15-20 .专门适用于不利环境

免登录下载普通用户下载升级VIP会员，免费下载

[发明专利]一种基于改进的MFCC声音特征的工程机械识别方法及识别装置在审

专利文献下载