[发明专利]一种具有音频分离声纹识别的湿地生态监测系统及其音频分离方法在审
申请号: | 202011566013.7 | 申请日: | 2020-12-25 |
公开(公告)号: | CN112735442A | 公开(公告)日: | 2021-04-30 |
发明(设计)人: | 刘添忻 | 申请(专利权)人: | 刘添忻 |
主分类号: | G10L17/26 | 分类号: | G10L17/26;G10L17/18;G10L25/24;G10L21/0208 |
代理公司: | 北京秉文同创知识产权代理事务所(普通合伙) 11859 | 代理人: | 孙富利;张文武 |
地址: | 310013 浙江省杭*** | 国省代码: | 浙江;33 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 具有 音频 分离 声纹 识别 湿地 生态 监测 系统 及其 方法 | ||
1.一种具有音频分离声纹识别的湿地生态监测系统,其特征在于,包括业务层、数据层、展示层;
所述业务层包括用户系统、业务系统、算法系统三大系统组成,所述用户系统用于管理平台用户操作行为及信息管理;所述业务系统用于管理整个平台模块之间的业务,包括如音频地址管理、鸟类声纹采集和鸟类音频识别信息;所述算法系统通过人工智能声纹识别检测音频中的鸟类的类型并给出合理的检测反馈信息;
所述数据层用于数据存储,包括数据中心、系统数据库和声纹数据库;所述数据中心用于存储业务数据,包括鸟类识别种类、数量、日期和位置;所述系统数据库存储系统模块之间的业务关系数据,包括声纹和音频存放地址;所述声纹数据库存储所有鸟类音频数据;
所述展示层通过WEB端输出各功能模块之间交互返回的结果,开放API接口调用方法开发者可通过相关开放接口地址按照提供的调用规则进行调用;
所述业务系统通过音频提取设备获取岛上的各种鸟类音频并提供频谱-时间空间界面进行录制、定位、分析、注解和分类,算法系统作为后台系统通过人工智能进行声纹识别,人工智能声纹识别包括噪声去除、多音频分离、自动分类、单一识别;
多音频分离的过程如下:
步骤1,傅里叶变换;
步骤2,转换正弦曲线函数;
步骤3,参数估计;
步骤4,估算鸟类音频的频率变化;
步骤5,分离音频。
2.一种根据权利要求1所述的一种具有音频分离声纹识别的湿地生态监测系统的音频分离方法,其特征在于,所述步骤1具体为:
对于一个任意分布函数x和一个测试函数ψ,在内积,上满足:x′,ψ=-x,ψ′,
则对于鸟类音频信号s视为一个分布,其满足:
s′wejω=-s′,w′ejω+jωs,wejω
其中,表示内积,′表示导数,w为有限时间窗函数,s为鸟类音频信号;
具有频率ω傅里叶变换函数Sw(ω)写成:Sw(ω)=s,wejω。
3.根据权利要求2所述的音频分离方法,其特征在于,所述步骤2具体为:
转换正弦曲线函数:
s(t)=er(t),
s(t)表示正弦曲线函数,t表示时间,r(t)表示非平稳函数,rk表示非平稳参数,k表示阶数,C正整数,
以下等式:
其中:
对于任何有限时间窗函数w,可用于定义相对于非平稳参数rk,k>0的线性方程组。
4.根据权利要求2所述的音频分离方法,其特征在于,所述步骤3具体为:
估计出非平稳参数rk,k>0,估计出复平稳参数r0,根据得到
其中,R(r(t))表示对非平稳函数r(t)的估计函数。
5.根据权利要求2所述的音频分离方法,其特征在于,所述步骤4具体为:
估算鸟类音频的频率变化,
用估计值代替参数rk,k>0,得到的估计值线性系统以不同频率下的值Sw,Sw’,Stw形成,最宽的主瓣宽度为w(t)t,总共5个部分,将典型的鸟类音频的频率变化从真实记录中估算出来。
6.根据权利要求2所述的音频分离方法,其特征在于,所述步骤5具体为:分离音频,频率下限ωL和频率上限ωH的频率和幅度估计值对Sw,Sw’,Stw的频谱进行划分,从而得到分离的单一的鸟类音频,下面进行识别。
7.根据权利要求6所述的音频分离方法,其特征在于:单一的鸟类音频的识别方法包括模型匹配和单一的鸟类音频的小波识别两种。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于刘添忻,未经刘添忻许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202011566013.7/1.html,转载请声明来源钻瓜专利网。