[发明专利]使用自适应阈值的说话者识别在审
申请号: | 201780021698.7 | 申请日: | 2017-02-21 |
公开(公告)号: | CN108885873A | 公开(公告)日: | 2018-11-23 |
发明(设计)人: | 纳拉彦·比斯瓦尔;格克肯·西林吉尔 | 申请(专利权)人: | 英特尔公司 |
主分类号: | G10L17/12 | 分类号: | G10L17/12;G10L17/20;G10L21/02 |
代理公司: | 北京东方亿思知识产权代理有限责任公司 11258 | 代理人: | 宗晓斌 |
地址: | 美国加利*** | 国省代码: | 美国;US |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 说话 自适应 噪声类型 噪声比 标签 语音 | ||
讨论了与说话者识别相关的技术。这种技术可以包括基于对应于所接收的音频的语音噪声比和噪声类型标签来确定自适应说话者识别阈值,并且基于自适应说话者识别阈值和对应于所接收的音频的说话者识别分数来执行说话者识别。
本申请要求于2016年3月29日递交的、序列号为15/083,548的、名称为“SPEAKERRECOGNITION USING ADAPTIVE THRESHOLDING(使用自适应阈值的说话者识别)”的美国专利申请的优先权,该专利申请的整体通过引用结合于此。
背景技术
说话者(speaker)识别是一种重要的应用,可以针对多因素生物识别设备登录或身份验证提供新形式。此外,说话者识别可以通过识别来自群组等中的特定说话者来将语音应用从通用应用转换为个性化应用。例如,识别来自群组的特定说话者可以提供改进的语音转录(例如,因为说话者的转录然后可以基于该说话者的特定特征)、将转录的特定部分与发出这些部分的说话者相关联等。
可以采用各种技术来执行说话者识别。例如,在其中可以基于说出的话语来识别或评估所声称的身份的说话者验证的上下文中,可以将基于话语和说话者模型的应用来评分的最终结果与阈值进行比较,该阈值可以量化对话语的肯定验证所需的最小相似度。例如,阈值可以提供错误拒绝和错误接受之间的平衡。
提供具有提高的准确度的说话者识别(例如,较低的错误拒绝率和错误接受率)可能是有利的。关于这些和其他考虑因素,需要目前的改进。随着对提供高质量说话者识别的期望变得更加普遍,这种改进可能变得至关重要。
附图说明
本文描述的材料通过示例的方式并且不通过附图中的限制的方式被示出。为了说明的简单性和清楚性,附图中示出的元件不一定是按比例绘制的。例如,为了清楚起见,一些元件的尺寸可能相对于其他元件被夸大。此外,在认为合适的情况下,在附图中重复附图标记以指示对应或类似的元件。在附图中:
图1是用于提供说话者识别的示例设置的说明图;
图2是用于提供说话者识别的示例系统的说明图;
图3示出了示例噪声特性预测模块;
图4示出了用于利用自适应阈值处理来执行说话者识别的示例过程;
图5示出了用于生成用于提供自适应说话者识别阈值的查找表的示例过程;
图6是示出用于提供说话者识别的示例过程的流程图;
图7是用于提供说话者识别的示例系统的说明图;以及
图8是示例系统的说明图;以及
图9示出了全部根据本公开的至少一些实现方式布置的示例设备。
具体实施方式
现在参考附图描述一个或多个实施例或实现方式。尽管讨论了具体的配置和布置,但应理解,这仅是为了说明性目的。相关领域技术人员将认识到,在不脱离本说明书的精神和范围的情况下,可以采用其他配置和布置。对于相关领域技术人员明显的是,本文描述的技术和/或布置也可以用于除本文描述的系统和应用之外的各种其他系统和应用中。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于英特尔公司,未经英特尔公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201780021698.7/2.html,转载请声明来源钻瓜专利网。
- 上一篇:应答生成装置、对话控制系统以及应答生成方法
- 下一篇:信息处理装置和方法