[实用新型]一种嵌入式音频播放装置有效
申请号: | 202020594937.7 | 申请日: | 2020-04-20 |
公开(公告)号: | CN212588503U | 公开(公告)日: | 2021-02-23 |
发明(设计)人: | 张时嘉;曾娟鹃;张亦农;王海业;由海 | 申请(专利权)人: | 南京西觉硕信息科技有限公司 |
主分类号: | H04R3/00 | 分类号: | H04R3/00;G10L15/26 |
代理公司: | 暂无信息 | 代理人: | 暂无信息 |
地址: | 211500 江苏省南京市*** | 国省代码: | 江苏;32 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 嵌入式 音频 播放 装置 | ||
1.一种嵌入式音频播放装置,包括扬声器和通信单元,其特征在于:还包括控制单元、存储单元、语音识别单元及提醒单元,
所述通信单元接收来自远端的音频流;
所述语音识别单元内设置有关键词识别模型单元,所述关键词识别模型单元内存储有基于场景的关键词识别模型;所述关键词和应用场景关联,其中包含一组在该应用场景中需要重点关注的词汇,所述词汇中的一个或多个由用户预先指定;
所述语音识别单元自所述音频流中提取语音信号,并采用所述基于场景的关键词识别模型实时检测所述语音信号中是否包含所述关键词;
所述控制单元用于在所述语音信号中包含关键词时,开始录制所接收的音频流,并控制所述提醒单元输出关键信息提醒;
所述存储单元用于存储被录制的音频流;
所述扬声器用于播放所述音频流,或响应于回放指令,回放所录制的音频流。
2.如权利要求1所述嵌入式音频播放装置,其特征在于:所述基于场景的关键词识别模型为预先在远端或云端基于包含针对所述关键词的语音样本,和/或针对所述关键词的特定人的语音样本的训练样本库,采用深度学习算法训练获得;
所述控制单元还用于通过所述通信单元自远端下载所述基于场景的关键词识别模型。
3.如权利要求2所述嵌入式音频播放装置,其特征在于:所述语音识别单元内还设置有语音预处理单元,其接收音频流,并对所述音频流进行预处理,以消除噪声、背景人声、音乐声,提取语音信号;
所述语音识别单元还设置有神经网络处理单元,用于基于所述关键词识别模型,采用深度学习算法对所述语音信号或所述语音预处理单元处理后的语音信号进行数据处理,从而对语音信号中出现的词汇进行推理和判决,以确定其中是否包含关键词词汇,并将判决结果反馈给所述控制单元。
4.如权利要求1所述装置,其特征在于:所述提醒单元为指示灯模组、振动器模组、文字消息生成模组、语音消息生成模组、音乐消息生成模组中的一种或多种。
5.如权利要求1所述装置,其特征在于:还包括输入单元,用于接收用户输入的录制停止指令、回放指令;
所述控制单元在接收到语音识别单元反馈的所述语音信号中包含关键词时,开始对接收到的音频流进行持续压缩编码并本地存储;
所述控制单元在接收到录制停止指令或持续录制时间超过第一预定时长时,停止录制;
所述控制单元在接收到回放本地音频指令时,播放本地存储的录制音频流;
所述控制单元还用于在接收到语音识别单元反馈的所述语音信号中包含关键词时,向远端发送用于使远端开始对所发送的音频流持续录制的录制开始指令;并当持续录制时间未超过第二预定时长且接收到停止录制指令时,向远端发送录制停止指令;
所述控制单元在接收到回放远端音频指令时,向远端发送回放请求,并接收和播放远端存储的录制音频流。
6.如权利要求1至5中之一所述装置,其特征在于:所述嵌入式音频播放装置为耳机或带通话功能的音箱。
7.如权利要求3所述装置,其特征在于:所述神经网络处理单元为嵌入式神经网络处理器、专用神经网络处理阵列处理单元、DSP、嵌入式处理器中的一种。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于南京西觉硕信息科技有限公司,未经南京西觉硕信息科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202020594937.7/1.html,转载请声明来源钻瓜专利网。