[发明专利]一种采用拾音器实时探测的鸟类识别方法有效
申请号: | 201910452436.7 | 申请日: | 2019-05-28 |
公开(公告)号: | CN110335613B | 公开(公告)日: | 2021-07-09 |
发明(设计)人: | 鲁仁全;郑鑫松;张斌;李鸿一;周琪 | 申请(专利权)人: | 广东工业大学 |
主分类号: | G10L17/26 | 分类号: | G10L17/26;G10L17/02;G10L17/04;G10L17/20;G10L25/24 |
代理公司: | 广东广信君达律师事务所 44329 | 代理人: | 杨晓松 |
地址: | 510062 广东*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 采用 拾音器 实时 探测 鸟类 识别 方法 | ||
本发明公开了一种采用拾音器实时探测的鸟类识别方法,该方法首先采集音频数据判断是否有鸟叫声,并进行环境自适应参数的采集与计算;当判断有鸟叫声后,进行鸟叫声语音数据采集和有效语音段的检测,针对于有效语音段进行预处理得到频谱,然后进行特征提取,在此基础上进行特征的再处理并将特征最终转换成字符串;将已知鸟类叫声的字符串作为训练特征模板,与待识别的测试特征模板进行匹配,得到最后的识别结果。本发明从数据采集、数据检测、数据预处理、特征提取到特征再处理,再到采用有效的特征匹配方法,大大地减少了数据量和计算量,使识别效率得到提高。
技术领域
本发明涉及声音识别技术领域,具体涉及一种采用拾音器实时探测的鸟类识别方法。
背景技术
鸟叫声识别和人类语音识别同属于生物识别,实现途径与方法几乎一致,而目前针对鸟叫声识别并不像人类语音识别那样能够做到实时识别,因为数据量的庞大与用途、目的的不同,大多数识别用途在于针对鸟叫声语言的细致研究。而目前亟需一种能够针对输电线路和机场害鸟的实时主动探测识别的方法。
现有的鸟叫声识别技术过程相仿,虽然能达到较高的识别率,但计算量和数据量普遍比较大,且对实时性要求并不高。
发明内容
本发明的目的在于提供一种能针对输电线路和机场害鸟的利用拾音器进行鸟类探测识别的方法,以减少识别过程中计算的数据量,提高识别效率。
为了实现上述任务,本发明采用以下技术方案:
一种采用拾音器实时探测的鸟类识别方法,包括以下步骤:
步骤1,采集音频数据并判断是否有鸟叫声
通过拾音器采集环境中的音频数据,具体采集方法为利用处理器中的定时器不断循环采样短时数据;每次采集音频数据后计算短时绝对值和,在连续几帧的短时绝对值和均超过设定的阈值时作为有鸟叫声的触发条件;当有判断有鸟叫声时,进行步骤2,否则重复步骤1;
步骤2,环境自适应参数的采集与计算
判断有鸟叫声后,采集当前鸟叫声的音频数据,先求取自适应参数,自适应参数包括零值、噪声阈值、过零率阈值和短时能量阈值,具体过程为:
利用处理器的定时器定时T采样数据,采集到数据后先用前S帧数据作为计算环境自适应参数的数据;
对所有采样数据进行检测,计算每一帧数据的短时绝对值和,当存在连续S帧短时绝对值和都小于设定的阈值时,则采用这S帧数据作为计算环境自适应参数的数据;
步骤3,当环境自适应参数计算完成后,利用计算好的环境自适应参数对当前采集的鸟叫声音频数据进行有效语音端点检测得到有效的语音段;具体为:
计算所有帧的短时绝对值和与短时过零率,用来做过渡判断,即判断是否为鸟叫声的语音段;其中,短时过零率计算方法为:
其中N为每一帧的长度,sgn(x)为符号函数,Di为点数值,T1=v_mid+n_gate为上门限值,T2=v_mid-n_gate为下门限值;
得到每一帧的短时绝对值和以及过零率后开始进行有效语音检测,过程为:
依次判断每一帧语音数据的短时绝对值、过零率这两个数据之一是否大于短时过零率阈值、短时能量阈值;
当连续frm_min帧语音数据的短时绝对值或过零率均大于短时过零率阈值或短时能量阈值时,视为有效语音段,记录有效语音段的起始位置;
当某一帧语音数据的短时绝对值、过零率均不大于短时过零率阈值、短时能量阈值时,开始计数帧长度;当连续超过设定的最长无效语音帧数frm_max时视为无效语音段,记录有效语音段的结束位置;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于广东工业大学,未经广东工业大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910452436.7/2.html,转载请声明来源钻瓜专利网。