[实用新型]基于存算一体的智能语音降噪装置、语音输入设备、系统有效
申请号: | 201921733712.9 | 申请日: | 2019-10-15 |
公开(公告)号: | CN211699712U | 公开(公告)日: | 2020-10-16 |
发明(设计)人: | 王绍迪 | 申请(专利权)人: | 北京知存科技有限公司 |
主分类号: | G10L21/02 | 分类号: | G10L21/02;G10L21/0208;G10L21/0232;G10L25/27;G10L25/84 |
代理公司: | 暂无信息 | 代理人: | 暂无信息 |
地址: | 100083 北京市*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 一体 智能 语音 装置 输入 设备 系统 | ||
本实用新型提供一种基于存算一体的智能语音降噪装置、语音输入设备以及电子系统,该基于存算一体的智能语音降噪装置包括:用于接收待处理的带噪语音的预处理模块、与该预处理模块连接的降噪模块以及与该预处理模块、该降噪模块连接的重建模块;该预处理模块将该待处理的带噪语音转换为频域信号;该降噪模块基于存算一体架构,对该频域信号的幅度谱进行降噪处理得到降噪后幅度谱;该重建模块根据该频域信号的相位谱以及该降噪后幅度谱进行信号重建得到降噪后语音;该降噪模块中预存深度学习降噪模型,其中,通过利用存算一体技术实现深度学习降噪模型进行智能语音降噪,扩展性好,硬件简单,能够直接应用到资源受限的离线终端场景。
技术领域
本实用新型涉及语音处理技术领域,尤其涉及一种基于存算一体的智能语音降噪装置、语音输入设备、系统。
背景技术
人工智能(Artificial Intelligence,AI),是研究、开发用于模拟、延伸和扩展人的智能的理论、方法、技术及应用系统的一门新的技术科学。人工智能是计算机科学的一个分支,它企图了解智能的实质,并生产出一种新的能以人类智能相似的方式做出反应的智能机器,该领域的研究包括机器人、语言识别、图像识别、自然语言处理和专家系统等。
随着人工智能的快速发展,智能语音识别技术应用广泛,例如:智能手机、无线耳机、智能机器人、车载设备等电子设备或系统中,均需要采用智能语音识别技术准确识别使用者输入的语音。但是,由于环境噪声和其他设备信号的干扰,输入语音中含有噪声,影响了语音识别的准确度。
传统的语音降噪方法通常基于统计模型的贝叶斯估计、谱减法等,这些方法的资源开销较大,硬件复杂,难以直接应用到资源受限的离线终端场景。
实用新型内容
针对现有技术中的问题,本实用新型提供一种基于存算一体的智能语音降噪装置、语音输入设备以及电子系统,能够至少部分地解决现有技术中存在的问题。
为了实现上述目的,本实用新型采用如下技术方案:
第一方面,提供一种基于存算一体的智能语音降噪装置,包括:用于接收待处理的带噪语音的预处理模块、与该预处理模块连接的降噪模块以及与该预处理模块、该降噪模块连接的重建模块;
该预处理模块将该待处理的带噪语音转换为频域信号;
该降噪模块基于存算一体架构,对该频域信号的幅度谱进行降噪处理得到降噪后幅度谱;
该重建模块根据该频域信号的相位谱以及该降噪后幅度谱进行信号重建得到降噪后语音;
其中,该降噪模块中预存深度学习降噪模型。
进一步地,该降噪模块的工作模式包括:处理模式以及编程模式;
该降噪模块在处理模式下对该频域信号的幅度谱进行降噪处理得到降噪后幅度谱,在编程模式下更新该深度学习降噪模型。
进一步地,该降噪模块包括:顺序连接的滤波电路、闪存处理阵列、模数转换模块以及后处理模块。
进一步地,该闪存处理阵列包括多个阵列排布的闪存单元,该闪存单元为阈值电压可调的可编程半导体器件。
进一步地,该闪存处理阵列包括多个阵列排布的闪存单元,该闪存单元包括:用于存储长时数据且阈值电压可调的可编程半导体器件以及用于存储临时数据的模拟电容单元,该可编程半导体器件与该模拟电容单元并联连接。
进一步地,该降噪模块还包括:编程电路,用于调控该闪存单元中存储的数据,以更新深度学习降噪模型的神经网络参数。
进一步地,该预处理模块包括:加窗单元以及傅里叶变换单元;
该加窗单元用于对该待处理的带噪语音进行加窗;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京知存科技有限公司,未经北京知存科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201921733712.9/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种自动售书机及其柜门
- 下一篇:偏振分束器组件以及立体图像设备