[发明专利]自适应日志模型和用户界面在审
申请号: | 201980098126.8 | 申请日: | 2019-07-01 |
公开(公告)号: | CN114175149A | 公开(公告)日: | 2022-03-11 |
发明(设计)人: | 亚伦·唐斯巴赫;德克·帕德菲尔德 | 申请(专利权)人: | 谷歌有限责任公司 |
主分类号: | G10L17/04 | 分类号: | G10L17/04;G10L17/22;G10L15/26;G10L15/22;G06F40/58 |
代理公司: | 上海华诚知识产权代理有限公司 31300 | 代理人: | 肖华 |
地址: | 美国加利*** | 国省代码: | 暂无信息 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 自适应 日志 模型 用户界面 | ||
1.一种方法,其特征在于,包括:
由计算设备接收在初始时间窗口期间捕获的并且表示第一语音和第二语音的第一音频波形;
由所述计算设备接收指示(i)所述第一语音对应于第一发言者和(ii)所述第二语音对应于第二发言者的第一类型的身份数据;
由所述计算设备基于所述第一语音、所述第二语音以及所述第一类型的所述身份数据来确定日志模型,所述日志模型被配置为区分所述第一发言者的语音与所述第二发言者的语音;
由所述计算设备接收并且仅接收指示第三语音的源发言者的所述第一类型的另外的身份数据,在随后的时间窗口期间捕获的并且表示所述第三语音的第二音频波形;
由所述计算设备通过所述日志模型并且独立于所述第一类型的所述另外的身份数据来确定所述第三语音的所述源发言者,其中,所述源发言者被确定为所述第一发言者或所述第二发言者;以及
由所述计算设备基于所述第三语音和所确定的所述源发言者来更新所述日志模型。
2.根据权利要求1所述的方法,其特征在于,进一步包括:
通过所述计算设备的用户界面并且在接收所述身份数据和所述第一音频波形之前,显示用于输入所述身份数据的视觉提示。
3.根据权利要求2所述的方法,其特征在于,所述第二音频波形在不显示所述另外的身份数据的所述视觉提示的情况下被接收。
4.根据权利要求2-3中任一项所述的方法,其特征在于,所述第一音频波形表示所述第一发言者的第一多个语音和所述第二发言者的第二多个语音,并且其中,所述方法还包括:
确定所述日志模型区分所述第一多个语音和所述第二多个语音的准确度;
确定所述准确度超过阈值准确度;以及
基于确定所述准确度超过所述阈值准确度,修改所述用户界面以从中移除所述视觉提示。
5.根据权利要求2-4中任一项所述的方法,其特征在于,所述视觉提示包括指示(i)所述第一发言者将在所述初始时间窗口期间说话持续至少第一时间段和(ii)所述第二发言者将在所述初始时间窗口期间说话持续至少第二时间段的指令,其中,所述第一时间段和所述第二时间段是互斥的,并且其中,接收所述身份数据包括:
在所述第一时间段期间捕获表示所述第一语音的所述第一音频波形的第一部分;以及
在所述第二时间段期间捕获表示所述第二语音的所述第一音频波形的第二部分。
6.根据权利要求1-4中任一项所述的方法,其特征在于,接收所述身份数据包括:
通过所述计算设备的用户界面接收对与所述第一发言者相对应的第一按钮的选择,其中,响应于对所述第一按钮的选择而捕获表示所述第一语音的所述第一音频波形的第一部分;以及
通过所述用户界面接收对与所述第二发言者相对应的第二按钮的选择,其中,响应于对所述第二按钮的选择而捕获表示所述第二语音的所述第一音频波形的第二部分。
7.根据权利要求1-6中任一项所述的方法,其特征在于,接收所述身份数据包括:
从相机设备接收表示说出所述第一语音的所述第一发言者的第一图像帧,其中,基于表示说出所述第一语音的所述第一发言者的所述第一图像帧,将表示所述第一语音的所述第一音频波形的第一部分与所述第一发言者相关联;以及
从所述相机设备接收表示说出所述第二语音的所述第二发言者的第二图像帧,其中,基于表示说出所述第二语音的所述第二发言者的所述第二图像帧,将表示所述第二语音的所述第一音频波形的第二部分与所述第二发言者相关联。
8.根据权利要求1-7中任一项所述的方法,其特征在于,所述日志模型包括:
波形嵌入模型,被配置为(i)接收波形的一部分作为输入,以及(ii)生成包括表示所述波形的所述部分的特性的多个值的嵌入向量;以及
向量分类模型,包括以下中的一个或多个:(i)基于所述嵌入向量的最近质心模型,(ii)基于所述嵌入向量的k最近邻模型,或(iii)基于所述嵌入向量的高斯分布朴素贝叶斯模型。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于谷歌有限责任公司,未经谷歌有限责任公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201980098126.8/1.html,转载请声明来源钻瓜专利网。
- 上一篇:自解耦紧凑型空腔天线
- 下一篇:一种传输信道状态信息的方法及装置