[发明专利]一种嵌入式语音交互系统有效
申请号: | 202010662649.5 | 申请日: | 2020-07-10 |
公开(公告)号: | CN111833875B | 公开(公告)日: | 2023-06-06 |
发明(设计)人: | 李重;王利平;徐超;高深 | 申请(专利权)人: | 安徽芯智科技有限公司 |
主分类号: | G10L15/22 | 分类号: | G10L15/22;G10L15/26;G10L15/20;G10L21/0208;G10L13/04;G10L13/047 |
代理公司: | 合肥正则元起专利代理事务所(普通合伙) 34160 | 代理人: | 韩立峰 |
地址: | 230000 安徽省合肥市高新区习友路3333*** | 国省代码: | 安徽;34 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 嵌入式 语音 交互 系统 | ||
本发明公开了一种嵌入式语音交互系统,包括音频输入模块、信号预处理模块、音频处理模块、本地语音识别模块、云端语音识别模块、仲裁模块、事件路由模块、调度模块、录入模块以及音频输出模块,所述音频输入模块用于将外界输入的语音,由语音信号转化为数据信号,并发送至信号预处理模块对数据信号进行预处理,所述信号预处理模块用于对输入音频进行回声消除、混响去除、DOA计算、VR噪音消除、蓝牙电话噪音消除;本软件音频输入后,进入Preproc信号预处理模块,该模块对输入音频进行回声消除、去混响、DOA计算、VR噪音消除、蓝牙电话噪音消除等操作,提高音频质量。
技术领域
本发明涉及智能语音交互技术领域,具体为一种嵌入式语音交互系统。
背景技术
人工智能的研发和应用进入了高速发展的阶段。其中,智能语音技术可谓是最具前景的领域之一,AI语音交互开始成为了人机交互的重要渠道。而在出行领域,搭载了语音交互技术的嵌入式语音交互软件,也将带来车内人机交互体验的又一次升级,目前市面上的语音交互功能在汽车上的存在感较弱,用户体验做的不够好。相对于市面上的语音交互软件,芯智科技的嵌入式语音交互软件在识别率、识别速度、语音理解能力、对于用户真实需求的感知以及在提升用户体验上要求极高,该软件方案包括拾音降噪,语音交互,云端计算和内容服务一揽子解决方案,解决车载垂直场景下,用户导航、电话、娱乐、咨询、社交5大场景的功能诉求,对于用户来说,该语音交互软件无疑是更好的选择。
但是现有技术中,语音交互软件的输入输出模块存在以下问题:
(1)接口和硬件资源相关,可能存在调用冲突;
(2)要考虑音频数据流处理的实时性,避免数据溢出:一方面对AudioIn产生的数据要迅速消费,另一方面要适当控制向AudioOut输出数据的速度;
(3)原始HAL硬件抽象层接口不够易用。
发明内容
针对现有技术存在的不足,本发明的目的就在于提出一种嵌入式语音交互系统,针对以上问题,提出以下解决方案:
(1)调用冲突的问题由Session调度器保证;
(2)引入“消费驱动”的概念:由消费者主动向数据源“Pull”数据,而不是由数据源向消费者“Push”;
(3)引入Buffer,谨慎设计Buffer的大小。
本发明的目的可以通过以下技术方案实现:
一种嵌入式语音交互系统,包括音频输入模块、信号预处理模块、音频处理模块、本地语音识别模块、云端语音识别模块、仲裁模块、事件路由模块、调度模块、录入模块以及音频输出模块;
所述音频输入模块用于将外界输入的语音,由语音信号转化为数据信号,并发送至信号预处理模块对数据信号进行预处理,所述信号预处理模块用于对输入音频进行回声消除、混响去除、DOA计算、VR噪音消除、蓝牙电话噪音消除,具体预处理步骤如下:
步骤一:对外界输入语音的频率和峰值进行监测和记录以及对外界输入的语音音频进行回声消除;
步骤二:对外界输入的语音进行混响去除;
步骤三:对外界输入的语音进行DOA计算;
步骤四:对外界输入的语音进行VR噪音消除;
步骤五:对外界输入的语音进行蓝牙电话噪音消除;
步骤六:将预处理后的语音的频率和峰值进行监测和记录;
步骤七:将预处理后的音频参数与预处理前的音频参数进行比较;
若预处理后的音频的频率大于预处理前的音频的频率,则再次进行信号预处理;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于安徽芯智科技有限公司,未经安徽芯智科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010662649.5/2.html,转载请声明来源钻瓜专利网。