[发明专利]基于深度学习的广告语音智能生成系统、方法及存储介质在审
申请号: | 202111598564.6 | 申请日: | 2021-12-24 |
公开(公告)号: | CN114283779A | 公开(公告)日: | 2022-04-05 |
发明(设计)人: | 熊义辉 | 申请(专利权)人: | 重庆杰夫与友文化创意有限公司 |
主分类号: | G10L13/02 | 分类号: | G10L13/02;G10L13/033;G10L13/08;G10H1/00;G06F16/683;G06F40/30;G06N3/04;G06Q30/02 |
代理公司: | 重庆强大凯创专利代理事务所(普通合伙) 50217 | 代理人: | 黄书凯 |
地址: | 401336 重庆市南岸区新*** | 国省代码: | 重庆;50 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 深度 学习 广告 语音 智能 生成 系统 方法 存储 介质 | ||
1.基于深度学习的广告语音智能生成系统,其特征在于:包括服务器,所述服务器包括以下模块:
需求获取模块:用于获取用户的广告配音需求和对应的配音准备文件;所述配音准备文件包括广告样片和配音文本;
广告分析模块:用于对广告样片进行内容分析,所述内容分析包括应用场景分析;
语音生成模块:用于根据应用场景分析从语音生成模型库中筛选语音生成模型,并将配音文本导入语音生成模型中,得到广告语音初版文件;
配乐选取模块:用于根据应用场景分析和广告语音初版文件的时间长度选取相匹配的背景音乐;
声音处理模块:用于将广告语音初版文件与背景音乐进行合成得到广告语音终版文件,并将广告语音终版文件发送给用户。
2.根据权利要求1所述的基于深度学习的广告语音智能生成系统,其特征在于:所述服务器还包括:
同类分析模块:用于根据应用场景分析查询同类别的优质广告,并获取其广告语音,再根据所述广告语音分析音调和音色;
所述语音生成模块用于在语音生成模型时,根据音调和音色从语音生成模型库中筛选音调和音色相近似或相同的语音生成模型。
3.根据权利要求2所述的基于深度学习的广告语音智能生成系统,其特征在于:所述服务器还包括:
文本分析模块:用于对配音文本进行语义分析,并根据语义分析将配音文本划分为多段配音文本短句,还用于各段配音文本短句匹配配音情绪,所述配音情绪包括舒缓、轻快、激昂;
成品分析模块:用于获取广告样片的播放时长和广告语音终版文件的时长,分析判断广告样片的播放时长是否适配广告语音终版文件的时长;
成品加工模块:用于在广告语音终版文件的时长不适配广告样片的播放时长时,根据各段配音文本短句的配音情绪来调整广告语音终版文件中对应部分的语速和音调。
4.根据权利要求3所述的基于深度学习的广告语音智能生成系统,其特征在于:所述背景音乐包括一首音乐、一段音乐或多段音乐的组合;所述服务器还包括:
背景音乐响度控制模块:用于获取广告语音初版文件的声音强度,并根据广告语音终版文件的声音强度调节背景音乐的声音强度;
过渡处理模块:用于对广告语音终版文件的开头进行过渡处理,还用于在背景音乐为多段音乐的组合时,在多段音乐之间进行过渡处理;所述过渡处理包括音调和响度的递增处理或递减处理。
5.基于深度学习的广告语音智能生成方法,其特征在于,包括以下步骤:
需求获取步骤:获取用户的广告配音需求和对应的配音准备文件;所述配音准备文件包括广告样片和配音文本;
广告分析步骤:对广告样片进行内容分析,所述内容分析包括应用场景分析;
语音生成步骤:根据应用场景分析从语音生成模型库中筛选语音生成模型,并将配音文本导入语音生成模型中,得到广告语音初版文件;
配乐选取步骤:根据应用场景分析和广告语音初版文件的时间长度选取相匹配的背景音乐;
声音处理步骤:将广告语音初版文件与背景音乐进行合成得到广告语音终版文件,并将广告语音终版文件发送给用户。
6.根据权利要求5所述的基于深度学习的广告语音智能生成方法,其特征在于:还包括以下步骤:
同类分析步骤:根据应用场景分析查询同类别的优质广告,并获取其广告语音,再根据所述广告语音分析音调和音色;
所述语音生成模块用于在语音生成模型时,根据音调和音色从语音生成模型库中筛选音调和音色相近似或相同的语音生成模型。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于重庆杰夫与友文化创意有限公司,未经重庆杰夫与友文化创意有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202111598564.6/1.html,转载请声明来源钻瓜专利网。