[发明专利]智能录音方法、装置、设备及存储介质有效
申请号: | 202111061087.X | 申请日: | 2021-09-10 |
公开(公告)号: | CN113571101B | 公开(公告)日: | 2022-09-20 |
发明(设计)人: | 费邑兵 | 申请(专利权)人: | 深圳市升迈电子有限公司 |
主分类号: | G11B20/10 | 分类号: | G11B20/10;G11C7/16;G10L17/02 |
代理公司: | 北京维正专利代理有限公司 11508 | 代理人: | 朱鹏程 |
地址: | 518101 广东省深圳市宝*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 智能 录音 方法 装置 设备 存储 介质 | ||
本申请涉及一种智能录音方法、装置、设备及存储介质,其中方法包括:接收并存储录音源对应的第一声音数据至预设的音频数据库;提取第一声音数据对应的声纹特征信息;存储第一声音数据对应的声纹特征信息至预设的录音源声纹数据库;接收用户输入的停止录音指令;接收第二声音数据,并提取第二声音数据对应的声纹特征信息;若录音源声纹数据库中存在有与第二声音数据对应的声纹特征信息相匹配的声纹特征信息,则存储第二声音数据至音频数据库。本申请具有的技术效果是:提高了录音效率。
技术领域
本申请涉及录音技术的领域,尤其是涉及一种智能录音方法、装置、设备及存储介质。
背景技术
目前,录音即是将声音信号记录在媒质上的过程。录音方法分为机械录音(唱片录音)、磁性录音、光学录音等,录音设备包括录音机、电脑、声卡、话筒和录音笔等。其中录音笔由于其方便携带以及功能多样,逐渐在许多应用场景中获得广泛使用。
录音笔在录音时通过对模拟信号的采样、编码将模拟信号通过数模转换器转换为数字信号,并进行一定的压缩后进行存储。而数字信号即使经过多次复制,声音信息也不会受到损失,保持原样不变。在使用的过程中,当需要录音时,用户打开录音笔,当录音对象暂停说话时,用户需关闭录音笔的录音功能,以减少录入无关杂音,当录音对象再次讲话时,用户需再次打开录音笔的录音功能。
针对上述中的相关技术,发明人认为存在有以下缺陷:在使用的过程中,用户需根据录音对象说话的停顿,反复开关录音笔的录音功能,因此易出现关闭后忘记再次打开的情况,导致需要录音的内容未能正常录入,从而使得录音效率较低。
发明内容
为了改善录音效率较低的问题,本申请提供一种智能录音方法、装置、设备及存储介质。
第一方面,本申请提供一种智能录音方法,采用如下技术方案:
接收并存储录音源对应的第一声音数据至预设的音频数据库;
提取所述第一声音数据对应的声纹特征信息;
存储所述第一声音数据对应的声纹特征信息至预设的录音源声纹数据库;
接收用户输入的停止录音指令;
接收第二声音数据,并提取第二声音数据对应的声纹特征信息;
若所述录音源声纹数据库中存在有与所述第二声音数据对应的声纹特征信息相匹配的声纹特征信息,则存储所述第二声音数据至所述音频数据库。
通过采用上述技术方案,使用时,用户通过录音设备对录音对象进行录音,当录音对象停止说话时,用户关闭录音笔的录音功能。当录音对象再次说话时,录音设备可自动打开录音功能进行录音,并存储声音数据,从而减少了因用户忘记打开录音设备的录音功能而导致需要录音的内容未能正常录入的可能,从而提高了录音效率。
可选的,在所述接收并存储录音源对应的第一声音数据至预设的音频数据库之后,还包括:
将所述第一声音数据对应的时间长度每间隔预设的时间段进行分段,直至剩余的时间长度小于所述时间段;
获取每个所述时间段在所述第一声音数据中对应的分段声音数据;
计算每个分段声音数据对应的最大响度值,作为每个分段声音数据对应的声音阈值;
将每个声音阈值乘以预设的环境噪声比,得出每个分段声音数据对应的环境噪声响度值;
将每个所述分段声音数据中响度值低于对应的所述环境噪声响度值的声音数据滤除。
通过采用上述技术方案,录音设备将声音数据分成若干段后,分别计算出每个分段声音数据对应的环境噪声响度值,并将每个分段声音数据中的环境噪声滤除,从而减少了环境噪声的干扰,使得提取出的第一声音数据的声纹特征更加准确。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于深圳市升迈电子有限公司,未经深圳市升迈电子有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202111061087.X/2.html,转载请声明来源钻瓜专利网。