[发明专利]基于语音迁移学习的亲子故事个性化音频生成系统及方法在审

专利信息
申请号: 202011622856.4 申请日: 2020-12-31
公开(公告)号: CN112786026A 公开(公告)日: 2021-05-11
发明(设计)人: 黄元忠;卢庆华;魏静 申请(专利权)人: 深圳市木愚科技有限公司
主分类号: G10L15/06 分类号: G10L15/06;G10L15/30;G10L13/02
代理公司: 北京华夏正合知识产权代理事务所(普通合伙) 11017 代理人: 韩登营
地址: 518052 广东省深圳市南山区南头*** 国省代码: 广东;44
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 基于 语音 迁移 学习 亲子 故事 个性化 音频 生成 系统 方法
【说明书】:

发明提供基于语音迁移学习的亲子故事个性化音频生成系统,包括:音频上传模块,用于将用户记录下的给孩子讲故事时的音频数据,通过客户端上传至服务器;其中,音频数据分别对应带有相应的用户标识;数据存储模块,用于根据用户标识,存储音频数据至对应用户标识的语音数据库中;数据处理模块,用于将语音数据库中存储的音频数据处理,成模型训练所需的音频数据输入和对应的文本输入数据;迁移训练模块,用于将数据处理模块处理后的音频数据,作为训练数据,通过迁移学习,训练构建出能够克隆出用户个性化声音的迁移模型;声音合成模块,用于将亲子故事\教学内容输入至迁移模型中,通过迁移模型合成基于用户个性化声音的故事\教学音频。

技术领域

本发明设计自动语音识别技术中语音合成、个性化语音故事合成,尤其设计基于迁移学习的亲子讲故事声音克隆;主要用于亲子之间讲故事常用,促进孩子的学习兴趣。

背景技术

语音识别是通过语音信号处理和模式识别让计算机能够自动识别和理解人类的口述语,随着语音识别技术的不断提高,机器对于语音信号的识别准确率也极大提升。语音识别是一门涉及面很广的交叉学科,它与声学、语音学、语言学、信息理论、模式识别理论以及神经生物学等学科都有非常密切的关系。语音合成是计算机接收到的文字信息转变为可以听得懂的、流畅的口语输出的技术。端到端的语音合成,可以直接利用录音文本和对应的语音数据对,进行模型训练,而无需过多的专家知识和专业处理能力,大大降低了进入语音合成领域的门槛,极大的促进了语音合成技术的进步。

风格转换是最早来源于图像领域的概念,即:将一张图片的艺术风格应用到另外一张图片上。音频中的风格迁移,是通过设计模型结构,使得模型学习音频的声纹特征,从而将输入的音频声音特征迁移到种子模型中,合成基于用户声音的亲子讲故事音频集,为用户提供更优质的教育服务,提升孩子的学习兴趣,促进亲子情感和互动。

发明内容

本发明的目的在于提供基于迁移学习的亲子讲故事声音克隆系统,根据用户自身提供的给孩子讲故事的音频数据,解析用户声纹信息,利用风格迁移,快速合成基于用户声音的亲子故事音频,自动化生成个性化教学课程,提升孩子的学习兴趣,促进亲子情感和互动。

本申请提供一种基于语音迁移学习的亲子故事个性化音频系统,包含以下模块:

音频上传模块,用于将用户记录下的给孩子讲故事时的音频数据,通过客户端上传至服务器;其中,上传的音频数据分别对应带有相应的用户标识;

数据存储模块,用于根据所述用户标识,存储所述音频数据至对应所述用户标识的语音数据库中;

数据处理模块,用于将所述语音数据库中存储的音频数据处理,成模型训练所需的音频数据输入和对应的文本输入数据;

迁移训练模块,用于将所述数据处理模块处理后的音频数据,作为训练数据,通过迁移学习,训练构建出能够克隆出用户个性化声音的迁移模型;

声音合成模块,用于将亲子故事\教学内容输入至所述迁移模型中,通过所述迁移模型合成基于用户个性化声音的故事\教学音频。

由上,本申请根据用户自身提供的给孩子讲故事的音频数据,解析用户声纹信息,利用风格迁移,快速合成基于用户声音的亲子故事音频,自动化生成个性化教学课程,提升孩子的学习兴趣,促进亲子情感和互动。

优选地,所述音频上传模块,包括:

匹配子模块,用于将用户输入用户名和密码与指定信息相匹配;

上传子模块,用于当所述用户输入用户名和密码与指定信息相匹配之后,将用户在客户端输入的音频数据分别对应标记相应的用户标识后上传至服务器。

优选地,所述数据存储模块,包括:

查询子模块,用于根据所述用户标识,在音频数据库中查询所述用户标识对应的数据表;

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于深圳市木愚科技有限公司,未经深圳市木愚科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/202011622856.4/2.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top