[发明专利]音效添加方法和装置、存储介质和电子设备在审
申请号: | 202010583097.9 | 申请日: | 2020-06-23 |
公开(公告)号: | CN111767740A | 公开(公告)日: | 2020-10-13 |
发明(设计)人: | 潘俊杰 | 申请(专利权)人: | 北京字节跳动网络技术有限公司 |
主分类号: | G06F40/30 | 分类号: | G06F40/30;G06F40/216;G06F16/35;G06F16/65;G10L25/63 |
代理公司: | 北京英创嘉友知识产权代理事务所(普通合伙) 11447 | 代理人: | 王晓霞 |
地址: | 100041 北京市石景山区*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 音效 添加 方法 装置 存储 介质 电子设备 | ||
1.一种音效添加方法,其特征在于,所述方法包括:
基于情感判定模型,确定待处理文本的每个语句的语句情感标签;
基于多个所述语句情感标签中数量最多的标签种类,确定所述待处理文本的情感偏移值;
针对所述待处理文本的每个段落,根据所述段落对应的多个语句的所述语句情感标签,确定所述段落的情感分布向量;
基于所述情感偏移值和所述段落对应的所述情感分布向量,确定所述段落的情感概率分布;
根据所述段落的所述情感概率分布和音效库中的多个音效的音效情感标签,确定与所述段落匹配的目标音效;
将所述目标音效添加至所述待处理文本对应的音频文件中与所述段落对应的音频位置。
2.根据权利要求1所述的方法,其特征在于,所述方法还包括:
根据所述语句情感标签的种类数目,以及预设的数目阈值,将所述待处理文本划分为多个结构段,其中,所述音效库中的音效根据结构段的类型分类;
所述根据所述段落的所述情感概率分布和音效库中的多个音效的音效情感标签,确定与所述段落匹配的目标音效,包括:
针对每个结构段中,将所述结构段中每一个所述段落的情感概率分布中概率值最大的情感种类,以及所述情感种类对应的概率值,添加至所述结构段的情感列表中;
根据所述情感列表,从所述音效库中与所述结构段对应的分类中,确定与所述情感列表匹配的多个目标音效。
3.根据权利要求2所述的方法,其特征在于,每个所述结构段还对应有预设音效数量,
所述根据所述情感列表,从所述音效库中与所述结构段对应的分类中,确定与所述情感列表匹配的多个目标音效,包括:
根据所述情感列表中的多个情感种类和所述情感种类对应的概率值,基于预设匹配条件,从所述音效库中与所述结构段对应的分类中确定多个目标音效,其中,所述目标音效的数量与所述预设音效数量一致。
4.根据权利要求1-3中任一所述的方法,其特征在于,所述基于所述情感偏移值和所述段落对应的所述情感分布向量,确定所述段落的情感概率分布,包括:
将所述情感偏移值与所述段落对应的所述情感分布向量中与所述情感偏移值对应的情感种类对应的分值叠加,确定目标情感分布向量;
基于预设的转换规则,将所述目标情感分布向量转换为所述段落的情感概率分布。
5.根据权利要求2或3任一项所述的方法,其特征在于,所述将所述目标音效添加至所述待处理文本对应的音频文件中与所述段落对应的音频位置,包括:
将所述多个目标音效添加至所述待处理文本对应的音频文件中与所述结构段对应的音频位置。
6.根据权利要求5所述的方法,其特征在于,所述将所述多个目标音效添加至所述待处理文本对应的音频文件中与所述结构段对应的音频位置,包括:
针对每一目标音效,确定所述目标音效的音效长度,并从所述结构段中确定文本长度与所述目标音效的音效长度所匹配的目标段落;
将所述目标音效,添加至所述音频文件中与所述目标段落对应的音频位置。
7.根据权利要求5所述的方法,其特征在于,所述情感列表中还包括所述段落的文本长度,所述目标音效的音频长度与所述段落的文本长度匹配;
所述将所述目标音效添加至所述待处理文本对应的音频文件中与所述段落对应的音频位置,包括:
针对每一目标音效,确定文本长度与所述目标音效的音效长度匹配的段落,并将所述目标音效添加至所述音频文件中与该段落对应的音频位置。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京字节跳动网络技术有限公司,未经北京字节跳动网络技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010583097.9/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种以轻量账本为特色的新型联盟链
- 下一篇:一种作业批改结果展示方法及装置