[发明专利]一种采用拾音器实时探测的鸟类识别方法有效
申请号: | 201910452436.7 | 申请日: | 2019-05-28 |
公开(公告)号: | CN110335613B | 公开(公告)日: | 2021-07-09 |
发明(设计)人: | 鲁仁全;郑鑫松;张斌;李鸿一;周琪 | 申请(专利权)人: | 广东工业大学 |
主分类号: | G10L17/26 | 分类号: | G10L17/26;G10L17/02;G10L17/04;G10L17/20;G10L25/24 |
代理公司: | 广东广信君达律师事务所 44329 | 代理人: | 杨晓松 |
地址: | 510062 广东*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明公开了一种采用拾音器实时探测的鸟类识别方法,该方法首先采集音频数据判断是否有鸟叫声,并进行环境自适应参数的采集与计算;当判断有鸟叫声后,进行鸟叫声语音数据采集和有效语音段的检测,针对于有效语音段进行预处理得到频谱,然后进行特征提取,在此基础上进行特征的再处理并将特征最终转换成字符串;将已知鸟类叫声的字符串作为训练特征模板,与待识别的测试特征模板进行匹配,得到最后的识别结果。本发明从数据采集、数据检测、数据预处理、特征提取到特征再处理,再到采用有效的特征匹配方法,大大地减少了数据量和计算量,使识别效率得到提高。 | ||
搜索关键词: | 一种 采用 拾音器 实时 探测 鸟类 识别 方法 | ||
【主权项】:
1.一种采用拾音器实时探测的鸟类识别方法,其特征在于,包括以下步骤:步骤1,采集音频数据并判断是否有鸟叫声通过拾音器采集环境中的音频数据,具体采集方法为利用处理器中的定时器不断循环采样短时数据;每次采集音频数据后计算短时绝对值和,在连续几帧的短时绝对值和均超过设定的阈值时作为有鸟叫声的触发条件;当有判断有鸟叫声时,进行步骤2,否则重复步骤1;步骤2,环境自适应参数的采集与计算判断有鸟叫声后,采集当前鸟叫声的音频数据,先求取自适应参数,自适应参数包括零值、噪声阈值、过零率阈值和短时能量阈值,具体过程为:利用处理器的定时器定时T采样数据,采集到数据后先用前S帧数据作为计算环境自适应参数的数据;对所有采样数据进行检测,计算每一帧数据的短时绝对值和,当存在连续S帧短时绝对值和都小于设定的阈值时,则采用这S帧数据作为计算环境自适应参数的数据;步骤3,当环境自适应参数计算完成后,利用计算好的环境自适应参数对当前采集的鸟叫声音频数据进行有效语音端点检测得到有效的语音段;具体为:计算所有帧的短时绝对值和与短时过零率,用来做过渡判断,即判断是否为鸟叫声的语音段;其中,短时过零率计算方法为:
其中N为每一帧的长度,sgn(x)为符号函数,
Di为点数值,T1=v_mid+n_gate为上门限值,T2=v_mid‑n_gate为下门限值;得到每一帧的短时绝对值和以及过零率后开始进行有效语音检测,过程为:依次判断每一帧语音数据的短时绝对值、过零率这两个数据之一是否大于短时过零率阈值、短时能量阈值;当连续frm_min帧语音数据的短时绝对值或过零率均大于短时过零率阈值或短时能量阈值时,视为有效语音段,记录有效语音段的起始位置;当某一帧语音数据的短时绝对值、过零率均不大于短时过零率阈值、短时能量阈值时,开始计数帧长度;当连续超过设定的最长无效语音帧数frm_max时视为无效语音段,记录有效语音段的结束位置;步骤4,对检测到的有效语音段进行预处理,预处理过程包括:数据预加重、加汉明窗和进行短时傅里叶变换,得出频谱;步骤5,特征提取取频谱的平方,得到能量谱,并用M个Mel带通滤波器进行滤波,输出Mel功率谱;对每个带通滤波器的输出值取对数,得到相应频带的对数功率谱,然后对m个对数功率进行反离散余弦变换得到M/2个MFCC系数;步骤6,特征再处理根据提取的特征数据,采用三种字符,将每帧数据根据特点比较转换为用一个字符代表,将有效语音段中所有数据帧提取的特征数据转换为字符后连接成为一个字符串,具体过程为:6.1对于提取到的每一帧的特征数据,按照以下公式进行再处理:
其中v_bound为界限值;6.2将每一帧特征数据计算得到的v值,根据以下公式进行变换:
步骤7,按照步骤1至步骤6的方法,进行已知鸟类的鸟叫声数据采集处理并将最终得到的字符串作为该已知鸟类的训练特征模板;将不同已知鸟类的训练特征模板构成训练数据库并存储到处理器中;步骤8,按照步骤1至6的方法进行待识别的鸟叫声数据采集处理并将最终得到的字符串作为测试特征模板,将测试特征模板与训练数据库中的每个训练特征模板形成二维数组,然后依次进行匹配,匹配公式如下:
其中,其中C[i,j]为最终的匹配长度,i,j分别代表测试特征模板与训练特征模板的各个长度位置,c[i‑1,j‑1]表示二维数组,xi,yi分别为其位置对应的字符;将所有匹配长度相加得到匹配值,得出匹配值如超过设定的匹配阈值,则认为匹配的测试特征模板对应的已知鸟类为识别结果。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于广东工业大学,未经广东工业大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201910452436.7/,转载请声明来源钻瓜专利网。