[发明专利]说话者验证方法和系统有效
申请号: | 201780019553.3 | 申请日: | 2017-02-21 |
公开(公告)号: | CN109155132B | 公开(公告)日: | 2023-05-30 |
发明(设计)人: | 斯里·哈利·克里希南·帕塔萨拉蒂;伯恩·霍夫迈斯特;布赖恩·金;罗兰·麦斯 | 申请(专利权)人: | 亚马逊技术公司 |
主分类号: | G10L17/18 | 分类号: | G10L17/18;G10L17/02;G10L15/02 |
代理公司: | 华进联合专利商标代理有限公司 44224 | 代理人: | 何冲;黄隶凡 |
地址: | 美国*** | 国省代码: | 暂无信息 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 一种被配置来处理语音命令的系统可将传入音频分类成期望语音、不期望的语音或非语音。期望语音是来自与参考语音是同一说话者的语音。可从配置会话或者从输入语音的包括唤醒词的第一部分来获得所述参考语音。可使用递归神经网络(RNN)编码器来对所述参考语音进行编码以创建参考特征向量。所述参考特征向量和传入音频数据可由训练神经网络分类器来处理,以关于每个帧是否由与所述参考语音相同的说话者说出而标记所述传入音频数据(例如,逐帧地)。所述标记可被传递到自动语音辨识(ASR)部件,所述自动语音辨识部件可允许所述ASR部件将其处理集中在所述期望语音上。 | ||
搜索关键词: | 说话 验证 方法 系统 | ||
【主权项】:
1.一种计算机实现的方法,其包括:接收输入音频数据;识别参考音频数据;利用递归神经网络来处理所述参考音频数据以确定参考特征向量;以及使用分类器来处理所述输入音频数据的一部分和所述参考特征向量,以确定所述部分是否对应于来自与所述参考音频数据是同一说话者的语音。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于亚马逊技术公司,未经亚马逊技术公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201780019553.3/,转载请声明来源钻瓜专利网。