[发明专利]自适应日志模型和用户界面在审
申请号: | 201980098126.8 | 申请日: | 2019-07-01 |
公开(公告)号: | CN114175149A | 公开(公告)日: | 2022-03-11 |
发明(设计)人: | 亚伦·唐斯巴赫;德克·帕德菲尔德 | 申请(专利权)人: | 谷歌有限责任公司 |
主分类号: | G10L17/04 | 分类号: | G10L17/04;G10L17/22;G10L15/26;G10L15/22;G06F40/58 |
代理公司: | 上海华诚知识产权代理有限公司 31300 | 代理人: | 肖华 |
地址: | 美国加利*** | 国省代码: | 暂无信息 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 自适应 日志 模型 用户界面 | ||
计算设备接收表示第一语音和第二语音的第一音频波形。该计算设备接收身份数据,该身份数据指示第一语音对应于第一发言者并且第二语音对应于第二发言者。所述计算设备基于所述第一语音、所述第二语音和所述身份数据来确定被配置为区分所述第一发言者的语音和所述第二发言者的语音的日志模型。计算设备仅通过接收指示第三语音的源发言者的另外的身份数据来接收表示第三语音的第二音频波形。计算设备通过日志模型并且独立于第一类型的另外的身份数据来确定第三语音的源发言者。计算设备基于第三语音和所确定的源发言者来更新日志模型。
背景技术
日志或发言者日志涉及根据发言者身份将音频数据划分为一个或多个部分。因此,诊断涉及回答问题“谁在何时说话?”因此,可以在语音转录、语音翻译或发言者身份是必要的或有用的任何上下文的上下文中使用日志过程或算法。
发明内容
可以训练日志模型来区分两个或多个发言者。训练可以基于监督数据集,该监督数据集包括波形和对应的提示/身份数据,该提示/身份数据指示哪个发言者在该波形区间内发言。一旦被训练,日志模型就可以用于确定语音的源发言者,而不依赖于进一步的提示/身份数据。当训练的模型做出这样的确定时,可以将该确定反馈到模型中,允许模型随时间增长和适应,从而提高其准确度。
例如,当在翻译应用的上下文中使用时,可以基于在预定时间轮流说话的用户来生成监督数据。例如,发言者可以在按下按钮之后说话,该按钮可以可选地对应于特定语言,从而生成伴随波形的提示/身份数据。在另一个示例中,可以为每个发言者提供相应的校准时间段,在在该时间段内要求他们说几个短语。在另一示例中,图像数据可以构成提示/身份数据,因为它可以通过表示发言者的面部运动来指示哪个发言者正在主动说话。
因此,在第一示例性实施例中,方法可以包括由计算设备接收在初始时间窗口期间捕获的并且表示第一语音和第二语音的第一音频波形。该方法还可以包括由计算设备接收指示(i)第一语音对应于第一发言者和(ii)第二语音对应于第二发言者的第一类型的身份数据。该方法还可以包括由该计算设备基于第一语音、第二语音以及第一类型的身份数据来确定日志模型,该日志模型被配置为区分该第一发言者的语音与该第二发言者的语音。该方法还可以包括由该计算设备接收指示第三语音的源发言者的该第一类型的进一步身份数据,该第二音频波形在随后的时间窗口期间被捕获并且表示该第三语音。该方法还可以附加地包括由计算设备通过日志模型并且独立于第一类型的另外的身份数据来确定第三语音的源发言者,其中源发言者被确定为第一发言者或第二发言者。该方法还可以包括由该计算设备基于该第三语音和所确定的源发言者来更新该日志模型。
在第二示例性实施例中,系统可以包括麦克风和被配置为执行操作的处理器。操作可以包括从麦克风接收在初始时间窗口期间捕获的并且表示第一语音和第二语音的第一音频波形。该操作还可包括接收指示(i)第一语音对应于第一发言者和(ii)第二语音对应于第二发言者的第一类型的身份数据。该操作还可以包括基于该第一语音、该第二语音和该第一类型的身份数据来确定被配置为区分该第一发言者的语音和该第二发言者的语音的日志模型。该操作还可以包括从麦克风接收指示第三语音的源发言者的第一类型的另外的身份数据,并且专门地接收在随后的时间窗口期间捕获的并且表示第三语音的第二音频波形。该操作还可以附加地包括通过该日志模型并且独立于该第一类型的另外的身份数据来确定该第三语音的源发言者,其中该源发言者被确定为该第一发言者或该第二发言者。该操作还可以包括基于该第三语音和所确定的源发言者来更新该日志模型。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于谷歌有限责任公司,未经谷歌有限责任公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201980098126.8/2.html,转载请声明来源钻瓜专利网。
- 上一篇:自解耦紧凑型空腔天线
- 下一篇:一种传输信道状态信息的方法及装置