[发明专利]一种配乐生成方法、存储介质及终端设备有效

申请号：	201810833951.5	申请日：	2018-07-26
公开（公告）号：	CN110767201B	公开（公告）日：	2023-09-05
发明（设计）人：	豆泽云	申请（专利权）人：	TCL科技集团股份有限公司
主分类号：	G10H1/00	分类号：	G10H1/00
代理公司：	深圳市君胜知识产权代理事务所(普通合伙) 44268	代理人：	王永文;刘文求
地址：	516006 广东省惠州市***	国省代码：	广东;44
权利要求书：	查看更多	说明书：	查看更多
摘要：
搜索关键词：	一种配乐生成方法存储介质终端设备
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【说明书】：

本申请公开了一种配乐生成方法、存储介质及终端设备，所述方法包括：接收用户输入的多媒体文件，其中，所述多媒体文件至少包含视频和/或图像；将所述多媒体文件转换为第一上下文向量；将所述第一上下文向量输入预设的神经网络以得到所述多媒体文件对应的音频信息；根据所述音频信息生成所述多媒体文件对应的配乐。本申请通过将多媒体文件对应的第一上下文向量输入预设神经网络中，通过所述神经网络生成所述多媒体文件的音频信息，在根据音频信息生成相应的配乐，以使得通过神经网络为多媒体文件配乐，从而实现了为自动为多媒体文件生成原创音频作为配乐，一方面提高了多媒体文件与配乐的匹配性，另一方面提高为多媒体文件配乐的便捷性和快速性。

技术领域

本申请涉及智能终端技术领域，特别涉及一种配乐生成方法、存储介质及终端设备。

背景技术

随着今年人工智能技术的快速发展，其领域内的神经网络技术的应用得到了广泛的研究和运用，从基于神经网络的图像分类，文本分类到文本生成，语音合成等等都体现了神经网络技术的强大能力。而目前为止这项技术多被用于在智能设备上的照相、照片处理以及个人语音助手等领域。但是，在智能设备使用过程中，还有许多功能可以应用神经网络技术。例如，智能终端在播放图像或视频的同时可以为其配置相应的音频文件（即为配乐），以提高图像和视频的播放意境。但是，现有技术中，终端设备在播放图像之前，通常需要人工选择与之相配合的配乐，以在播放图像或视频时同步播放，这种人工选择的处理方式人为主观性比较大，并且容易出现播放图像与配乐不匹配的问题。因此，如何将神经网络技术应用于为图像或视频进行配乐，成为人们关注的焦点。

发明内容

本申请要解决的技术问题在于，针对现有技术的不足，提供一种配乐生成方法、存储介质及终端设备，以实现通过神经网络为多媒体文件生成配乐。

本申请所采用的技术方案如下：

一种配乐生成方法，其包括：

接收用户输入的多媒体文件，其中，所述多媒体文件至少包含视频和/或图像；

将所述多媒体文件转换为第一上下文向量；

将所述第一上下文向量输入预设的神经网络以得到所述多媒体文件对应的音频信息；

根据所述音频信息生成所述多媒体文件对应的配乐。

所述的述配乐生成方法，其中，所述将所述多媒体文件转换为第一上下文向量具体为：

将所述多媒体文件输入预设的第一编码神经网络，通过所述第一编码神经网络编码以得到第一上下文向量。

所述的述配乐生成方法，其中，所述将所述多媒体文件转换为第一上下文向量还包括：

提取所述多媒体文件包含的视频，并在提取到视频时按照预设策略在提取到的各视频中分别抽取若干图像帧；