首页在售求购查询申请展会资讯专利榜企服商城升级VIP

立即登录免费注册

在售专利
求购专利
查询专利
新闻资讯
技术展会
招商加盟
专利榜

本网专利代理业务由天津创信方达专利代理事务所(普通合伙)承接机构代码：12247 本网专利代理业务由天津创信方达专利代理事务所(普通合伙)承接机构代码：12247 本网专利代理业务由天津创信方达专利代理事务所(普通合伙)承接机构代码：12247

本网专利代理业务由天津创信方达专利代理事务所(普通合伙)承接机构代码：12247 本网专利代理业务由天津创信方达专利代理事务所(普通合伙)承接机构代码：12247 本网专利代理业务由天津创信方达专利代理事务所(普通合伙)承接机构代码：12247

[发明专利]一种基于风格化的手势生成方法及生成系统在审

申请号：	202011200335.X	申请日：	2020-11-03
公开（公告）号：	CN112329593A	公开（公告）日：	2021-02-05
发明（设计）人：	不公告发明人	申请（专利权）人：	北京中科深智科技有限公司
主分类号：	G06K9/00	分类号：	G06K9/00;G06K9/62;G10L13/04
代理公司：	暂无信息	代理人：	暂无信息
地址：	100000 北京市丰台区航***	国省代码：	北京;11
权利要求书：	查看更多	说明书：	查看更多
摘要：
搜索关键词：	一种基于风格手势生成方法系统
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【权利要求书】：

1.一种基于风格化的手势生成方法，其特征在于，包括：

步骤S1，以演讲者的身份信息、演讲音频信息、演讲语音文本以及所述演讲者的演讲手势为训练样本，训练形成一手势生成模型；

步骤S2，通过所述手势生成模型获取说话人的讲话节奏特征和手势姿态动作风格特征；

步骤S3，输入语音文本；

步骤S4，通过所述手势生成模型将所述语音文本生成为语音音频，然后将步骤S2获取的关联所述说话人的所述讲话节奏特征和所述手势姿态动作风格特征与生成的所述语音音频进行特征融合后，生成符合所述说话人的姿态动作风格和讲话风格的手势姿态。

2.根据权利要求1所述的基于风格化的手势生成方法，其特征在于，所述步骤S1中，训练所述手势生成模型的方法包括如下步骤：

步骤L1，获取演讲视频数据集，并将所述演讲视频数据集划分为样本集和测试集；

步骤L2，提取或识别所述样本集中各所述演讲者的身份信息、演讲音频信息、演讲语音文本以及所述演讲者的手势姿态；

步骤L3，以各所述演讲者的身份信息、演讲音频信息、演讲语音文本以及所述演讲者的手势姿态特征为训练样本，通过神经网络训练形成一手势生成初始模型；

步骤L4，提取或识别所述测试集中的演讲者的身份信息、演讲音频信息、演讲语音文本以及所述演讲者的手势姿态；

步骤L5，将所述步骤L4提取或识别的所述演讲者的身份信息、演讲音频信息和演讲语音文本输入到所述手势生成初始模型中，所述手势生成初始模型生成手势姿态；

步骤L6，将所述手势生成初始模型生成的手势姿态与所述步骤L4提取或识别的关联所述演讲者的原始手势姿态进行姿态比对，并根据比对结果调整所述神经网络训练所述手势生成模型的网络参数；

步骤L7，根据调整后的所述网络参数，对所述手势生成初始模型进行更新训练，最终训练形成所述手势生成模型。

3.根据权利要求2所述的基于风格化的手势生成方法，其特征在于，所述步骤L6中，比对手势姿态的方法为计算模型生成的手势姿态和所述原始手势姿态间的身体关节位置的误差。

4.根据权利要求2所述的基于风格化的手势生成方法，其特征在于，所述步骤S4中，所述手势生成模型生成符合所述说话人姿态动作风格和讲话风格的手势姿态的方法包括：

所述手势生成模型通过一编码器从所述说话人的音频信息中提取所述说话人的讲话节奏特征；

所述手势生成模型基于所述说话人的身份信息，生成所述说话人的手势姿态动作风格特征；

所述手势生成模型基于所述说话人的所述说话语音文本生成语音音频；

所述手势生成模型将提取的所述讲话节奏特征融合到所生成的所述语音音频中，然后将将已融合了所述讲话节奏特征的所述语音音频与生成的关联所述说话人的所述手势姿态动作风格特征进行进一步的特征融合，最终生成符合所述说话人的姿态动作风格和讲话风格的手势姿态。

5.一种基于风格化的手势生成系统，可实现如权利要求1-4任意一项所述的手势生成方法，其特征在于，包括：

手势生成模型训练模块，用于以演讲者的身份信息、演讲音频信息、演讲语音文本以及所述演讲者的演讲手势为训练样本，训练形成一手势生成模型；

说话人音频信息和身份信息获取模块，用于获取说话人的音频信息和身份信息；

语音文本输入模块，用于输入所述说话人的说话语音文本；

手势姿态生成模块，连接所述语音文本输入模块、所述说话人音频信息和身份信息获取模块以及所述手势生成模型训练模块，用于以所述说话人的音频信息、身份信息以及所述说话语音文本为说话人的三模态输入到所述手势生成模型中，所述手势生成模型生成符合说话人姿态动作风格和讲话风格的手势姿态。

下载完整专利技术内容需要扣除积分，VIP会员可以免费下载。

免登录下载普通用户下载升级VIP会员，免费下载

该专利技术资料仅供研究查看技术是否侵权等信息，商用须获得专利权人授权。该专利全部权利属于北京中科深智科技有限公司，未经北京中科深智科技有限公司许可，擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作，请联系【客服】

本文链接：http://www.vipzhuanli.com/pat/books/202011200335.X/1.html，转载请声明来源钻瓜专利网。

上一篇：辐射计接收机用低噪声高增益直流放大积分电路
下一篇：一种基于重力自动调速的防辐射服清洗装置

同类专利

专利分类

G06 计算；推算；计数
G06K 数据识别；数据表示；记录载体；记录载体的处理
G06K9-00 用于阅读或识别印刷或书写字符或者用于识别图形，例如，指纹的方法或装置
G06K9-03 .错误的检测或校正，例如，用重复扫描图形的方法
G06K9-18 .应用具有附加代码标记或含有代码标记的打印字符的，例如，由不同形状的各个笔画组成的，而且每个笔画表示不同的代码值的字符
G06K9-20 .图像捕获
G06K9-36 .图像预处理，即无须判定关于图像的同一性而进行的图像信息处理
G06K9-60 .图像捕获和多种预处理作用的组合

免登录下载普通用户下载升级VIP会员，免费下载

友情链接：交换友情链接需要网站权重大于4，网站收录10W以上，如符合条件，请联系QQ：。

关于我们寻求报道投稿须知广告合作版权声明网站地图友情链接企业标识联系我们

在线咨询

周一至周五 9:00-18:00

版权所有http://www.vipzhuanli.com/公布日期

咨询在线客服

咨询在线客服

tel code back_top