[发明专利]语音识别设备和方法在审
申请号: | 201880082848.X | 申请日: | 2018-12-19 |
公开(公告)号: | CN111492425A | 公开(公告)日: | 2020-08-04 |
发明(设计)人: | 徐钻源;金叡薰;尹昭正 | 申请(专利权)人: | 三星电子株式会社 |
主分类号: | G10L15/16 | 分类号: | G10L15/16;G10L15/04;G10L15/28;G10L15/22;G10L21/0208;G10L17/00 |
代理公司: | 北京市柳沈律师事务所 11105 | 代理人: | 邵亚丽 |
地址: | 韩国*** | 国省代码: | 暂无信息 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 语音 识别 设备 方法 | ||
1.一种语音识别设备,包括:
麦克风;和
处理器,被配置为通过所述麦克风接收话音信号,
通过使用基于神经网络的数据识别模型分析所述话音信号来生成话音特征数据,
基于所述话音特征数据来确定所述话音信号是从用户发出的话音还是从外部设备输出的话音,以及
当所述话音信号被确定为从用户发出的话音时,将所述话音信号确定为用户的话音命令,并执行对应于所述话音命令的操作。
2.根据权利要求1所述的语音识别设备,其中,所述处理器还被配置为当所述话音信号被确定为从外部设备输出的话音时,过滤所述话音信号。
3.根据权利要求1所述的语音识别设备,其中,所述处理器还被配置为通过分析所述话音信号是否是根据压缩的话音信号的重构信号来生成所述话音特征数据。
4.根据权利要求1所述的语音识别设备,其中,所述处理器还被配置为通过分析所述话音信号是否包括电噪声来生成所述话音特征数据。
5.根据权利要求1所述的语音识别设备,其中,所述处理器还被配置为通过分析所述话音信号的输出位置来生成所述话音特征数据。
6.根据权利要求5所述的语音识别设备,其中,所述处理器还被配置为预先设置从外部设备输出的话音信号的至少一个输出位置,以及
通过确定所述话音信号的输出位置是否对应于预先设置的输出位置来生成所述话音特征数据。
7.根据权利要求5所述的语音识别设备,其中,所述处理器还被配置为通过确定输出所述话音信号的输出位置的数量来生成所述话音特征数据。
8.根据权利要求1所述的语音识别设备,还包括
照相机,
其中所述处理器还被配置成
通过使用所述照相机获取所述语音识别设备的外围的图像,以及
基于所获取的外围图像中是包括用户还是外部设备,来确定所述话音信号是用户发出的话音还是外部设备输出的话音。
9.根据权利要求8所述的语音识别设备,其中,所述处理器还被配置为预先设置被授权发出话音命令的注册用户的面部识别数据,以及
当确定所获取的外围图像中的用户对应于预先设置的面部识别数据时,将所述话音信号确定为用户的话音命令,并执行对应于所述话音命令的操作。
10.根据权利要求1所述的语音识别设备,其中,所述处理器还被配置为预先设置被授权发出话音命令的注册用户的话音识别数据,以及
当确定所述话音信号对应于预先设置的话音识别数据时,将所述话音信号确定为用户的话音命令,并执行对应于所述话音命令的操作。
11.一种语音识别设备的操作方法,所述操作方法包括:
通过麦克风接收话音信号;
通过使用基于神经网络的数据识别模型分析话所述话音信号来生成话音特征数据;
通过使用所述数据识别模型,基于所述话音特征数据来确定所述话音信号是从用户发出的话音还是从外部设备输出的话音;和
当所述话音信号被确定为用户发出的话音时,将所述话音信号确定为用户的话音命令,并执行对应于所述话音命令的操作。
12.根据权利要求11所述的操作方法,还包括当所述话音信号被确定为从外部设备输出的话音时,过滤所述话音信号。
13.根据权利要求11所述的操作方法,其中所述话音特征数据的生成包括通过分析所述话音信号是否是根据压缩的话音信号的重构信号来生成所述话音特征数据。
14.根据权利要求11所述的操作方法,其中,所述话音特征数据的生成包括通过分析所述话音信号是否包括电噪声来生成所述话音特征数据。
15.一种计算机可读记录介质,其上记录有用于执行根据权利要求11所述的方法的程序。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于三星电子株式会社,未经三星电子株式会社许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201880082848.X/1.html,转载请声明来源钻瓜专利网。
- 上一篇:衍射波导元件和衍射波导显示器
- 下一篇:个人清洁组合物