[发明专利]语音用户接口在审
申请号: | 201780034684.9 | 申请日: | 2017-06-06 |
公开(公告)号: | CN109313903A | 公开(公告)日: | 2019-02-05 |
发明(设计)人: | C·巴克罗阿维莱斯-卡斯柯;D·马丁内斯冈萨雷斯;R·罗伯茨 | 申请(专利权)人: | 思睿逻辑国际半导体有限公司 |
主分类号: | G10L17/22 | 分类号: | G10L17/22;G06F21/32;G10L15/08 |
代理公司: | 北京北翔知识产权代理有限公司 11285 | 代理人: | 陈璐;郑建晖 |
地址: | 英国*** | 国省代码: | 英国;GB |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 言语信号 认证 语音用户接口 认证结果 认证请求 输出 响应 | ||
一种认证说话人的方法,包括:接收言语信号;将该言语信号分成多个段;以及在每个段之后基于所述段和先前接收的段获得认证得分,其中该认证得分表示该言语信号来自特定的注册说话人的可能性;以及响应于认证请求,基于该认证得分输出认证结果。
技术领域
本文所描述的实施方案涉及用于在语音用户接口(voice user interface)中使用的方法和系统,例如用于允许用户使用言语(speech)来控制设备的操作。
背景技术
提供语音用户接口以允许用户使用他们的语音与系统交互。这样的一个优点(例如在诸如智能手机、平板计算机等的设备中)是它允许用户以免手持方式操作设备。
在一个典型的系统中,用户通过说出触发短语来将语音用户接口从低功率待机模式唤醒。言语识别技术被用来检测已经说出了触发短语,并且单独地,说话人识别过程被用来确认触发短语是由设备的注册用户说出的。
然后,语音用户接口可以向用户提供提示,以确认系统是活动的(active),然后用户可以说出命令,该命令可以由语音用户接口使用言语识别技术识别。
然后,语音用户接口可以对说出的命令起作用。例如,如果说出的命令要求公开可得的信息,则说出的命令可以被识别,并且被用来生成对因特网搜索引擎的查询,以能够将信息提供给用户。
然而,在其他情况下,例如如果说出的命令涉及个人信息,则由说话人识别过程提供的认证级别可能被认为不足以使语音用户接口对该命令起作用。在这样的情况下,可能要求用户提供附加形式的认证,例如通过设备的小键盘输入PIN号码或密码,或通过提供附加的生物认证,诸如指纹扫描。
这意味着用户不再能够以免手持方式操作设备。
发明内容
根据本文描述的实施方案,提供了减少或避免上文所提及的缺点中的一个或多个的方法和系统。
根据本发明的第一方面,提供了一种认证说话人的方法,包括:
接收言语信号;
将该言语信号分成多个段;
在每个段之后基于所述段和先前接收的段获得认证得分,其中该认证得分表示该言语信号来自特定的注册说话人的可能性;以及
响应于认证请求,基于该认证得分输出认证结果。
可以通过将该言语信号的特征与在登记该注册说话人期间生成的模型进行比较来获得该认证得分。
该言语信号可以表示多个离散的言语片段。
第一段可以表示触发短语。然后该方法可以包括响应于检测到该触发短语已经被说出执行获得认证得分的步骤和输出认证结果的步骤。
该方法可以包括在该触发短语之后,将该言语信号划分成多个长度相等的段。例如,该方法可以包括在该触发短语之后,将该言语信号划分成多个覆盖相等长度的时间周期的段,或可以包括在该触发短语之后,将该言语信号划分成多个包括相等持续时间的净言语的段。
该方法可以包括将该认证得分与第一阈值得分进行比较,并且如果该认证得分超过该第一阈值得分,则确定肯定的认证结果。
可以响应于从一个单独的过程接收的信号来设定该第一阈值得分。
该方法可以包括从该单独的过程接收信号,以及从多个可用的阈值得分选择该第一阈值得分。
从该单独的过程接收的信号可以指示请求的安全级别。
该单独的过程可以是一个言语识别过程。
该方法可以包括将该认证得分与第二阈值得分进行比较,并且如果该认证得分在该第二阈值得分以下,则确定否定的认证结果。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于思睿逻辑国际半导体有限公司,未经思睿逻辑国际半导体有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201780034684.9/2.html,转载请声明来源钻瓜专利网。
- 上一篇:语音用户接口
- 下一篇:音频信号之间的声道间相位差的编码和解码