[发明专利]说话人识别有效
申请号: | 201780047190.4 | 申请日: | 2017-08-01 |
公开(公告)号: | CN109564759B | 公开(公告)日: | 2023-06-09 |
发明(设计)人: | J·P·莱索;J·梅兰森 | 申请(专利权)人: | 思睿逻辑国际半导体有限公司 |
主分类号: | G10L17/02 | 分类号: | G10L17/02 |
代理公司: | 北京北翔知识产权代理有限公司 11285 | 代理人: | 陈璐;郑建晖 |
地址: | 英国*** | 国省代码: | 暂无信息 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 说话 识别 | ||
本申请描述了用于说话人识别的方法和装置。根据一个实施方案的装置具有一个分析器(202),用于分析与用户发出的言语声音对应的音频数据(Asubgt;IN/subgt;)的帧的序列中的每个帧,以确定该帧的言语声音的至少一个特性。一个评估模块(203),用于基于该言语声音的确定的特性为音频数据的每个帧确定音频数据的帧应被用于说话人识别处理的程度的贡献指标。以此方式,可以强调与对说话人区分最有用的言语声音对应的帧和/或可以不再强调与对说话人区分最没有用的言语声音对应的帧。
技术领域
本公开内容的代表性实施方案的领域涉及与生物测定说话人识别相关或有关的方法、装置或实施方式。应用包括但不限于与说话人登记(enrolment)或验证相关的应用,尤其是在存在环境影响(诸如背景噪声)的情况下。
背景技术
提供语音(voice)用户接口以允许用户使用他们的语音与系统交互。此接口的一个优点(例如在诸如智能手机、平板计算机等的设备中)是它允许用户以免手持方式操作设备的至少一些方面。言语(speech)识别技术(即从语音音频信号提取说出的单词的技术)可以例如被用来检测已经说出了特定的触发短语以将设备设定为预期说出的命令并且在说出时识别命令并且作出响应执行操作。例如,如果该说出的命令要求公开可得的信息,则该接口可以导致向互联网搜索引擎提交查询,以能够将该信息供应给用户。
然而,在其他情况下,例如如果说出的命令涉及个人信息或请求某种金融交易,则可能期望某种水平的认证以在按照任何命令行动之前验证用户的身份。
为了维持大致免手持的用户交互模式,语音用户接口可以包括某种形式的说话人识别(即对语音音频输入信号进行某种分析),以提取与一个或多个用户中的一个不同的那个信号的特性。因此,可以以具有比口令(password)更高安全性的高置信水平(confidencelevel)并且比其他生物测定验证方法(诸如指纹或虹膜图案)更便利地验证用户的身份。
可以根据错误接受率(FAR)和错误拒绝率(FRR)来表征此用户验证的准确性。FAR量化了不同用户被错误地认证为授权用户的概率,对于特定用户具有明显的金融安全性风险和隐私风险。FRR量化了有效用户可能被拒绝的概率,这给用户带来了不便,然后用户可能不得不重复他的尝试或使用某种其他形式的认证。
说话人识别过程可以依赖于将当前的言语样本的频谱特性与先前登记的言语样本的频谱特性进行比较。然而,认证尝试期间的任何背景噪声可能被叠加在说话人的语音上并且可能隐藏或更改频谱特征并因此在比较中给出错误。登记期间的背景噪声可能相反地添加在安静环境中认证时不存在的特征。这些影响可能降低FAR或FRR,具有上文描述的不期望的安全性后果或用户不便后果。
使用信号处理以试图去除添加到信号的噪声的来减轻该问题的尝试可能影响所得到的补偿言语的频谱特性并且因此再次降低准确性。
根据一个实施方案,提供了一种用于在生物测定说话人识别中使用的装置,包括:
一个分析器,用于分析与由用户发出的言语声音对应的音频数据的帧的序列中的每个帧,以确定该帧的言语声音的至少一个特性;以及
一个评估模块,用于基于确定的该言语声音的至少一个特性为音频数据的每个帧确定音频数据的每个帧应被用于说话人识别处理的程度(extent)的贡献指标(contribution indicator)。
在一些实施方案中,该装置可以包括一个说话人识别模块,该说话人识别模块被配置成将说话人识别处理应用于音频数据的帧,其中该说话人识别模块被配置成根据每个帧的贡献指标来处理音频数据的帧。
所述贡献指标可以包括在说话人识别处理中将被应用于每个帧的加权。在一些情况下,所述贡献指标可以包括对将不在说话人识别处理中使用的音频数据的帧的选择。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于思睿逻辑国际半导体有限公司,未经思睿逻辑国际半导体有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201780047190.4/2.html,转载请声明来源钻瓜专利网。