[发明专利]说话人识别在审

申请号：	201780071869.7	申请日：	2017-12-01
公开（公告）号：	CN110024027A	公开（公告）日：	2019-07-16
发明（设计）人：	M·佩奇;C·巴克罗阿维莱斯-卡斯柯	申请（专利权）人：	思睿逻辑国际半导体有限公司
主分类号：	G10L17/22	分类号：	G10L17/22
代理公司：	北京北翔知识产权代理有限公司 11285	代理人：	关丽丽;郑建晖
地址：	英国***	国省代码：	英国;GB
权利要求书：	查看更多	说明书：	查看更多
摘要：
搜索关键词：	说话人识别信号执行话语禁用说话人识别系统过程检测开始事件响应
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【说明书】：

一种说话人识别系统的操作的方法，包括：对所接收的信号执行说话人识别过程；当已经识别了第一说话人时，禁用所述说话人识别过程；当禁用了所述说话人识别过程时，对所接收的信号执行话语开始识别过程；响应于所述话语开始识别过程检测到所接收的信号中的话语开始事件而启用所述说话人识别过程。

本公开内容的代表性实施方案的领域涉及与说话人识别有关或相关的方法、装置和/或实施方式，也就是说，涉及话语(speech)通道中的一个或多个说话人的自动识别。

语音(voice)生物测定技术被用于说话人识别，且此技术的一种用途是在语音捕获设备中。这样的设备使用一个或多个麦克风来检测声音，且在任何时间确定谁正在说话。该设备通常还执行话语识别过程。然后可以使用关于谁正在说话的信息，例如以决定是否响应于说出的命令，或以决定如何响应于说出的命令，或以注释话语的转写本(transcript)。该设备还可以执行其他功能，诸如电话功能和/或话语记录。

然而，执行说话人识别消耗功率。

本公开内容的实施方案涉及可以帮助减少此功率消耗的方法和装置。

因此，根据本发明，提供了一种说话人识别系统的操作的方法，所述方法包括：对所接收的信号执行说话人识别过程；当已经识别了第一说话人时，禁用所述说话人识别过程；当禁用了所述说话人识别过程时，对所接收的信号执行话语开始识别过程；以及，响应于所述话语开始识别过程检测到所接收的信号中的话语开始事件而启用所述说话人识别过程。

根据本发明，还提供了一种说话人识别系统的操作的方法，所述方法包括：接收表示话语的数据；且在多个相继的时间：使用从开始时间直到那个时间所接收的所有数据，获得表示所述话语是已登记用户的话语的置信度的匹配分数；将所述匹配分数与上限阈值和下限阈值比较；且如果所述匹配分数高于所述上限阈值，则确定所述话语是已登记用户的话语并且终止所述方法，或如果所述匹配分数低于所述下限阈值，则确定所述话语不是已登记用户的话语并且终止所述方法。

根据本发明的其他方面，提供了说话人识别系统，所述说话人识别系统被配置为根据这些方法中的任一种方法进行操作，且提供了计算机程序产品，所述计算机程序产品包括计算机可读介质，所述计算机可读介质包含用于使处理器执行这些方法中的任一种方法的指令。

为了更好地理解本公开内容的实施例，且为了更清楚地示出如何有效地实施所述实施例，现在将仅通过实施例的方式参考下面的附图，在附图中：

图1例示了被配置用于作为语音捕获设备操作的智能电话。

图2例示了专用语音捕获设备。

图3是语音捕获设备的示意性例示。

图4是示出了多个过程的进程的时间历史。

图5是例示了说话人识别方法的流程图。

下文的描述阐述了根据本公开内容的示例性实施方案。另一些示例性实施方案和实施方式对于本领域普通技术人员来说将是明显的。此外，本领域普通技术人员将认识到，可以应用多种等同技术来代替下文所讨论的实施方案或与下文所讨论的实施方案结合，且所有这样的等同物应被视为被本公开内容包含。

图1示出了电子设备10的一个实施例，诸如智能电话或其他移动电话，或平板计算机。

在图1中示出的实施例中，设备10具有多个声音入口12、14，所述声音入口允许麦克风(未示出在图1中)检测环境声音。该设备可以具有不止两个这样的麦克风，例如定位在该设备的其他表面上。

电子设备10可以设有合适的软件(或者作为它的标准操作软件的一部分，或者是单独下载的)，允许它作为语音捕获设备操作，如下文更详细描述的。

图2例示了专用语音捕获设备30的一个实施例。