[发明专利]身份验证的方法、装置、计算机设备及存储介质有效
申请号: | 201910711306.0 | 申请日: | 2019-08-02 |
公开(公告)号: | CN110379433B | 公开(公告)日: | 2021-10-08 |
发明(设计)人: | 刘加;刘艺;何亮;张卫强 | 申请(专利权)人: | 清华大学;北京华控智加科技有限公司 |
主分类号: | G10L17/14 | 分类号: | G10L17/14;G06F21/32 |
代理公司: | 北京华进京联知识产权代理有限公司 11606 | 代理人: | 朱五云 |
地址: | 100084*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 身份验证 方法 装置 计算机 设备 存储 介质 | ||
1.一种身份验证的方法,其特征在于,所述方法包括:
获取目标用户根据目标动态验证码输入的语音数据;
根据预设的分段算法,将所述语音数据划分为至少一个语音帧;
针对每个语音帧,根据预设的声学特征提取算法,提取该语音帧对应的声学特征向量;
将该语音帧对应的声学特征向量输入至身份验证多任务模型中的多任务共享隐含层,输出该语音帧对应的中间特征向量;
将该语音帧对应的中间特征向量输入至所述身份验证多任务模型中的语音识别网络,输出该语音帧对应的发音特征向量和第一后验概率集合,所述第一后验概率集合包括各预设发音单元对应的后验概率;
将该语音帧对应的中间特征向量和发音特征向量输入至所述身份验证多任务模型中的声纹识别网络,输出该语音帧对应的中间用户特征向量;
根据各语音帧对应的中间用户特征向量和预设的池化算法,确定所述目标用户对应的第一用户特征向量;
根据所述目标用户对应的第一用户特征向量和所述各语音帧对应的第一后验概率集合,对所述目标用户进行身份验证。
2.根据权利要求1所述的方法,其特征在于,所述根据所述目标用户对应的第一用户特征向量和所述各语音帧对应的第一后验概率集合,对所述目标用户进行身份验证,包括:
根据所述各语音帧对应的第一后验概率集合,确定所述目标用户对应的目标动态验证码分数;
如果所述第一用户特征向量与预先存储的所述目标用户对应的第二用户特征向量的相似度大于或等于预设的相似度阈值,且所述目标动态验证码分数大于或等于预设的动态验证码分数阈值,则确定所述目标用户为合法用户;
如果所述第一用户特征向量与所述第二用户特征向量的相似度小于所述预设的相似度阈值,或者所述目标动态验证码分数小于所述预设的动态验证码分数阈值,则确定所述目标用户为非法用户。
3.根据权利要求2所述的方法,其特征在于,所述根据所述各语音帧对应的第一后验概率集合,确定所述目标用户对应的目标动态验证码分数,包括:
获取所述目标动态验证码对应的发音单元序列;
根据所述各语音帧对应的第一后验概率集合、所述发音单元序列和预设的强制对齐算法,确定各语音帧对应的目标发音单元;
针对每个语音帧,在该语音帧对应的第一后验概率集合中,确定该语音帧对应的目标发音单元的后验概率,并确定该目标发音单元的后验概率与预先存储的该目标发音单元的先验概率的乘积,作为该目标发音单元的似然值;
根据所述各语音帧对应的目标发音单元的似然值,确定所述目标用户对应的目标动态验证码分数。
4.根据权利要求3所述的方法,其特征在于,所述获取所述目标动态验证码对应的发音单元序列,包括:
根据所述目标动态验证码和预设的分词算法,确定所述目标动态验证码对应的单词集合;
针对所述单词集合中的每个单词,根据预先存储的单词和发音单元序列的对应关系,确定该单词对应的发音单元序列;
将各单词对应的发音单元序列按照所述各单词在所述目标动态验证码中的顺序进行排序,得到所述目标动态验证码对应的发音单元序列。
5.根据权利要求3所述的方法,其特征在于,所述根据所述各语音帧对应的目标发音单元的似然值,确定所述目标用户对应的目标动态验证码分数,包括:
针对每个语音帧,确定该语音帧对应的目标发音单元的似然值与该语音帧对应的所述各预设发音单元的似然值中的最大似然值的差值,作为该语音帧对应的动态验证码分数;
确定所述各语音帧对应的动态验证码分数的平均值,作为所述目标用户对应的目标动态验证码分数。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于清华大学;北京华控智加科技有限公司,未经清华大学;北京华控智加科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910711306.0/1.html,转载请声明来源钻瓜专利网。