[发明专利]使用机器学习模型确定与实时语音相对应的嘴部的运动在审

申请号：	201910179536.7	申请日：	2019-03-07
公开（公告）号：	CN110624247A	公开（公告）日：	2019-12-31
发明（设计）人：	W·李;J·波波维克;D·阿尼加;D·西蒙斯	申请（专利权）人：	奥多比公司
主分类号：	A63F13/822	分类号：	A63F13/822;G06K9/00;G06N3/04;G06N3/08
代理公司：	11256 北京市金杜律师事务所	代理人：	酆迅;彭梦晔
地址：	美国加利***	国省代码：	美国;US
权利要求书：	查看更多	说明书：	查看更多
摘要：	所公开的系统和方法从音频序列预测视位。视位生成应用访问第一训练数据集，该第一训练数据集包括表示由第一讲话者说出的句子的第一音频序列和视位序列。每个视位被映射到第一音频序列的相应音频样本。视位生成应用创建第二训练数据集，以调节由说出该句子的第二讲话者说出的第二音频序列，使得第二序列和第一序列具有相同的长度，并且至少一个音素出现在第一序列和第二序列中的相同时间戳处。视位生成应用将视位序列映射到第二音频序列，并且训练视位预测模型以从音频序列预测视位序列。
搜索关键词：	音频序列视位训练数据集视位序列映射句子音频样本应用访问预测模型时间戳预测音素应用讲话创建
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【主权项】：

1.一种从音频序列预测视位的方法，所述方法包括：/n访问第一训练数据集，所述第一训练数据集包括：/n(i)表示由第一讲话者说出并且具有第一长度的句子的样本的第一音频序列，其中所述音频序列表示音素序列，以及/n(ii)视位序列，其中每个视位被映射到所述第一音频序列的相应音频样本；/n通过以下创建第二训练数据集：/n访问表示由第二讲话者说出并且具有第二长度的相同句子的样本的第二音频序列，其中所述第二音频序列包括所述音素序列；/n调节所述第二音频序列，使得(i)第二序列长度等于所述第一长度，并且(ii)至少一个音素出现在所述第一音频序列和所述第二音频序列中的相同时间戳处；/n将所述视位序列映射到所述第二音频序列；以及/n训练视位预测模型以从所述第一训练数据集和所述第二训练数据集预测视位序列。/n

下载完整专利技术内容需要扣除积分，VIP会员可以免费下载。

免登录下载普通用户下载升级VIP会员，免费下载

该专利技术资料仅供研究查看技术是否侵权等信息，商用须获得专利权人授权。该专利全部权利属于奥多比公司，未经奥多比公司许可，擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作，请联系【客服】

本文链接：http://www.vipzhuanli.com/patent/201910179536.7/，转载请声明来源钻瓜专利网。

上一篇：虚拟资源获取方法及装置、存储介质及电子设备
下一篇：游戏控制的方法、装置、电子设备和存储介质

同类专利

专利分类

A 农业

A63 运动；游戏；娱乐活动
A63F 纸牌、棋盘或轮盘赌游戏；利用小型运动物体的室内游戏；其他类目不包含的游戏
A63F13-00 使用二维或多维电子显示器
A63F13-02 .附件
A63F13-08 .结构零件或布置，例如其他类目不包括的壳体、导线、连接件、操纵台
A63F13-10 .游戏过程的控制，例如开始、进行、结束
A63F13-12 .涉及若干游戏装置之间的相互作用，例如传送和分配系统
A63F13-04 ..用于命中显示器上的特殊区域，如具有光电探测装置的

免登录下载普通用户下载升级VIP会员，免费下载

[发明专利]使用机器学习模型确定与实时语音相对应的嘴部的运动在审

专利文献下载