[发明专利]异常音检测系统、伪音生成系统及伪音生成方法在审
申请号: | 202010459129.4 | 申请日: | 2020-05-27 |
公开(公告)号: | CN112116924A | 公开(公告)日: | 2020-12-22 |
发明(设计)人: | 川口洋平 | 申请(专利权)人: | 株式会社日立制作所 |
主分类号: | G10L25/24 | 分类号: | G10L25/24;G10L25/30;G10L25/51 |
代理公司: | 永新专利商标代理有限公司 72002 | 代理人: | 安香子 |
地址: | 日本*** | 国省代码: | 暂无信息 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 异常 检测 系统 生成 方法 | ||
1.一种异常音检测系统,判定声音数据中包含的异常音,其特征在于,
上述异常音检测系统具有终端和服务器;
上述终端具有:
对数梅尔频谱计算部,以上述声音数据为输入,计算对数梅尔频谱;
统计量计算部,根据对数梅尔频谱,计算表示各频率的振幅时间序列的直流成分、交流成分、噪声成分各自的大小的统计量的组;以及
统计量发送部,发送上述统计量的组;
上述服务器具有:
统计量接收部,接收上述统计量的组;
特征量向量生成部,从根据上述统计量的组生成的伪对数梅尔频谱,提取特征量向量;以及
正常音模型学习部,使用上述特征量向量学习正常音模型;
上述终端从上述对数梅尔频谱提取特征量向量,从上述服务器接收正常音模型,计算相当于从上述正常音模型生成上述特征量向量的概率或距离的值,在相当于该概率或距离的值小于规定值的情况下,判定为包含异常音,向上述服务器报告。
2.如权利要求1所述的异常音检测系统,其特征在于,
上述对数梅尔频谱计算部代替对数梅尔频谱而计算倍频带频谱、1/3倍频带频谱、伽马通频谱或表示频率功率特性的任意的频谱。
3.如权利要求1所述的异常音检测系统,其特征在于,
在上述终端的上述对数梅尔频谱计算部的前级还具备非稳定成分除去部,该非稳定成分除去部从根据所输入的上述声音数据生成的功率谱中除去非稳定音,提取周期稳定的声音。
4.如权利要求1所述的异常音检测系统,其特征在于,
在上述服务器中,基于事先从诊断对象设备录音的非压缩的工作音及根据该工作音计算出的表示各频率的振幅时间序列的直流成分、交流成分、噪声成分各自的大小的统计量的组,学习从统计量的组向非压缩的声音的频谱的映像;
上述服务器还具备伪频谱直接复原部,该伪频谱直接复原部基于学习的映像,根据服务器接收到的统计量的组生成伪功率谱。
5.如权利要求4所述的异常音检测系统,其特征在于,
构成为,上述学习的映像由多层神经网络进行模型化,随机相位生成部随机地生成各频率k的相位φ(k),输入到多层神经网络的中间层的各频率k的分支的后方的单元。
6.如权利要求1所述的异常音检测系统,其特征在于,
上述终端根据上述统计量计算部计算出的统计量的组生成伪对数梅尔频谱,从上述伪对数梅尔频谱和其时间差分信号的组中提取特征量向量,从上述服务器接收正常音模型,计算从上述正常音模型生成上述特征量向量的概率,在该概率小于规定的概率的情况下,判定为包含异常音,向上述服务器报告。
7.一种伪音生成系统,其特征在于,
具有终端和服务器;
上述终端具有:
对数梅尔频谱计算部,以声音数据为输入,计算对数梅尔频谱;
统计量计算部,根据对数梅尔频谱,计算表示各频率的振幅时间序列的直流成分、交流成分、噪声成分各自的大小的统计量的组;以及
统计量发送部,发送上述统计量的组;
上述服务器具有:
统计量接收部,接收上述统计量的组;
伪频谱复原部,对根据上述统计量的组生成的伪对数梅尔频谱乘以梅尔滤波器组的伪逆矩阵而计算伪功率谱;
频域-时域变换部,对于上述伪功率谱,生成各频率的相位成分并与上述伪功率谱组合而输出时域的数字输出信号;以及
伪音再现部,再现上述时域的数字输出信号。
8.如权利要求7所述的伪音生成系统,其特征在于,
上述对数梅尔频谱计算部代替对数梅尔频谱而计算倍频带频谱、1/3倍频带频谱、伽马通频谱或表示频率功率特性的任意的频谱。
9.如权利要求7所述的伪音生成系统,其特征在于,
在上述终端的上述对数梅尔频谱计算部的前级还具备非稳定成分除去部,该非稳定成分除去部从根据所输入的上述声音数据生成的功率谱中除去非稳定音,提取周期稳定的声音。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于株式会社日立制作所,未经株式会社日立制作所许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010459129.4/1.html,转载请声明来源钻瓜专利网。