[发明专利]一种声音采集对象声纹检测方法、装置和设备在审

申请号：	201980003351.9	申请日：	2019-12-24
公开（公告）号：	CN111108553A	公开（公告）日：	2020-05-05
发明（设计）人：	陈昊亮;罗伟航	申请（专利权）人：	广州国音智能科技有限公司
主分类号：	G10L17/02	分类号：	G10L17/02;G10L17/16;G10L17/00
代理公司：	深圳市深佳知识产权代理事务所(普通合伙) 44285	代理人：	王兆林
地址：	510000 广东省广州市黄埔***	国省代码：	广东;44
权利要求书：	查看更多	说明书：	查看更多
摘要：
搜索关键词：	一种声音采集对象声纹检测方法装置设备
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【说明书】：

本申请公开了一种声音采集对象声纹检测方法、装置和设备，将收集到的采集对象的音频转换为PCM编码的WAV格式文件，然后进行音频切除、分帧和声学特征提取处理，得到帧率矩阵，通过隐马尔可夫模型进行音频识别，根据隐马尔可夫模型的输出结果判断音频是否为正常的采集对象声音，实现了对采集对象的声音是否正常的识别检测。

技术领域

本申请涉及音频识别技术领域，尤其涉及一种声音采集对象声纹检测方法、装置和设备。

背景技术

声纹是用电声学仪器显示的携带言语信息的声波频谱，不同的人在讲话时使用是发生器官在尺寸和形态方面的差异比较大，所以任何两个人的声纹图谱都有差异。使用声纹识别技术，可以把声信号转换成电信号，再用计算机进行识别，从而得到声纹识别结果。

声纹识别需要进行采集对象的声音采集，声音采集过程中可能会夹杂背景声音或非采集对象的对象发出的声音，这些非目标采集对象的声音会对采集对象的声音检测存在干扰，因此，有必要对采集到的音频进行声纹识别，判断音频是否存在波形失真，音频是否为正常的采集对象的声音。

发明内容

本申请提供了一种声音采集对象声纹检测方法、装置和设备，用于检测采集到的音频是否为采集对象的正常声音。

有鉴于此，本申请第一方面提供了一种声音采集对象声纹检测方法，包括：

将采集对象的音频转换成PCM编码处理的WAV格式文件；

将所述WAV格式文件的首尾段静音切除，得到待处理PCM音频流；

基于移动窗函数对所述PCM音频流进行声音分帧；

对声音分帧后的所述PCM音频流进行波形变换，进行声纹特征提取后得到帧率矩阵；