[发明专利]样本生成、模型训练、口型驱动方法、装置、设备及介质在审

申请号：	202110642755.1	申请日：	2021-06-09
公开（公告）号：	CN113314145A	公开（公告）日：	2021-08-27
发明（设计）人：	陀得意;林哲;司季雨;韩欣彤;康世胤;刘峰;游于人;许佳	申请（专利权）人：	广州虎牙信息科技有限公司
主分类号：	G10L25/24	分类号：	G10L25/24;G10L25/30;G10L25/87;G06F40/30;G06F40/289;G06N3/04;G06N3/08
代理公司：	北京品源专利代理有限公司 11332	代理人：	孟金喆
地址：	511442 广东省广州市番禺***	国省代码：	广东;44
权利要求书：	查看更多	说明书：	查看更多
摘要：
搜索关键词：	样本生成模型训练口型驱动方法装置设备介质
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【说明书】：

本发明实施例公开了一种样本生成、模型训练、口型驱动方法、装置、设备及介质。其中，方法包括：捕捉得到真实人物在讲话过程中形成的语音片段和口型驱动参数序列；根据驱动结果，将口型驱动参数序列与语音片段进行时间对齐；识别语音片段中的各有效语音段的起止时间，并根据起止时间，在口型驱动参数序列中分别确定与各有效语音段分别对应的口型驱动参数子序列；根据与有效语音段对应的内容表征向量，以及与有效语音段对应的口型驱动参数子序列，形成用于训练得到口型驱动参数识别模型的训练样本对。本发明实施例的方案，生成了用于训练口型驱动参数识别模型的高质量样本，为训练得到高精度的口型驱动参数识别模型提供依据。

技术领域

本发明实施例涉及人工智能技术，尤其涉及一种样本生成、模型训练、口型驱动方法、装置、设备及介质。

背景技术

随着科学技术的不断发展，人工智能在诸如直播、智能交通以及智慧医疗等领域得到了广泛地发展及应用。

在人工智能领域中，训练样本的好坏直接影响训练得到的网络模型的精度；如何生成高精度的训练样本得到了业界的广泛研究。

发明内容

本发明实施例提供一种样本生成、模型训练、口型驱动方法、装置、设备及介质，以生成用于训练口型驱动参数识别模型的样本，为训练得到高精度的口型驱动参数识别模型提供依据。

第一方面，本发明实施例提供了一种训练样本的生成方法，包括：

捕捉得到真实人物在讲话过程中形成的语音片段和口型驱动参数序列；

使用口型驱动参数序列对虚拟人物进行连续口型驱动，并根据驱动结果，将所述口型驱动参数序列与所述语音片段进行时间对齐；

识别语音片段中的各有效语音段的起止时间，并根据起止时间，在口型驱动参数序列中分别确定与各有效语音段分别对应的口型驱动参数子序列；

根据与有效语音段对应的内容表征向量，以及与有效语音段对应的口型驱动参数子序列，形成用于训练得到口型驱动参数识别模型的训练样本对。