[发明专利]一种语音识别方法、装置及计算设备在审
申请号: | 201811340092.2 | 申请日: | 2018-11-12 |
公开(公告)号: | CN111179940A | 公开(公告)日: | 2020-05-19 |
发明(设计)人: | 赵情恩;索宏彬;刘刚;卓著;雷赟;张平;孙尧 | 申请(专利权)人: | 阿里巴巴集团控股有限公司 |
主分类号: | G10L17/00 | 分类号: | G10L17/00;G10L17/02;G10L17/14;G06F16/65;H04L29/06 |
代理公司: | 北京思睿峰知识产权代理有限公司 11396 | 代理人: | 彭晓雪;谢建云 |
地址: | 开曼群岛大开曼*** | 国省代码: | 暂无信息 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 语音 识别 方法 装置 计算 设备 | ||
1.一种语音识别方法,包括步骤:
接收包括第一语音的音频数据;
判断是否存在与所述第一语音相匹配的用户;
在不存在与所述第一语音相匹配的用户的情况下,存储所述音频数据;
对所存储的多条音频数据进行聚类,以便从所述多条音频数据中确定新用户。
2.如权利要求1所述的方法,其中,所述用户对应有用户简档,所述用户简档包括所述用户的声纹,所述判断是否存在与所述第一语音相匹配的用户的步骤包括:
判断所述第一语音是否与所述用户的声纹相匹配,以判断是否存在与所述第一语音相匹配的用户。
3.如权利要求2所述的方法,其中,所述对所存储的多条音频数据进行聚类,以便从所述多条音频数据中确定新用户的步骤包括:
基于所述多条音频数据中两两之间的相似评分,将所述多条音频数据划分为多个集合;
基于所述集合的样本密度和样本数量确定至少一个目标集合,所述目标集合对应于所述新用户;
为所述目标集合对应的新用户创建用户简档,并使用所述目标集合中的至少部分音频数据来生成该新用户的声纹。
4.如权利要求3所述的方法,其中,所述使用所述目标集合中的至少部分音频数据来生成该新用户的声纹的步骤包括:
根据到所述目标集合的质心的距离来确定所述目标集合中用于生成新用户的声纹的音频数据。
5.如权利要求3所述的方法,其中,所述用户简档包括指示用户是否为主动注册的用户标记,所述为所述目标集合对应的新用户创建用户简档的步骤包括:
将为目标集合对应的新用户所创建的用户简档中的用户标识置为非主动注册;以及
所述方法还包括步骤:
在存在与所述第一语音相匹配的用户且对应的用户标记指示所述用户为非主动注册的情况下,记录来自所述用户的音频数据条数。
6.如权利要求5所述的方法,其中,还包括步骤:
在记录来自所述用户的音频数据条数之后,判断所述音频数据条数是否在特定时间段内达到特定数量;若否,删除所述用户对应的用户简档。
7.如权利要求2所述的方法,其中,所述用户简档还包括与用户相关联的终端设备的设备标识,所述方法包括步骤:
接收发送所述音频数据的终端设备的设备标识;
基于所述设备标识判断是否存在与所述终端设备相关联的用户;
如果不存在,则存储所述音频数据。
8.如权利要求1所述的方法,其中,还包括步骤:
在存在与所述第一语音相匹配的用户的情况下,将所述第一语音对应的指令与所述用户相关联地存储。
9.如权利要求1-8中任一项所述的方法,其中,还包括步骤:
接收包括第二语音的音频数据,所述第二语音用于主动注册新用户;
为主动注册的新用户创建用户简档,并使用所述包括第二语音的音频数据来生成所述新用户的声纹;以及
将为主动注册的新用户所创建的用户简档中的用户标识置为主动注册。
10.如权利要求9所述的方法,其中,还包括步骤:
接收发送包括第二语音的音频数据的终端设备的设备标识;
将所述设备标识与所述主动注册的新用户相关联地存储至对应的用户简档。
11.如权利要求2-10中任一项所述的方法,其中,所述判断所述第一语音是否与所述用户的声纹相匹配的步骤包括:
根据所述包括第一语音的音频数据,提取第一语音的语音特征;
基于所述第一语音的语音特征得到所述第一语音与用户的声纹之间的相似评分;
根据所述相似评分来确定第一语音是否与用户的声纹相匹配。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于阿里巴巴集团控股有限公司,未经阿里巴巴集团控股有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201811340092.2/1.html,转载请声明来源钻瓜专利网。