[发明专利]将音效自动添加到音频文件中在审
申请号: | 201980025776.X | 申请日: | 2019-01-25 |
公开(公告)号: | CN112041809A | 公开(公告)日: | 2020-12-04 |
发明(设计)人: | 邹超;宋睿华;刘伟;曾敏 | 申请(专利权)人: | 微软技术许可有限责任公司 |
主分类号: | G06F3/16 | 分类号: | G06F3/16 |
代理公司: | 永新专利商标代理有限公司 72002 | 代理人: | 张立达 |
地址: | 美国华*** | 国省代码: | 暂无信息 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 音效 自动 添加 音频文件 | ||
1.一种用于将音效自动添加到音频文件中的方法,包括:
从与所述音频文件相对应的文本内容中识别至少一个触发词;
从所述文本内容确定所述至少一个触发词的上下文信息;
基于所述至少一个触发词的所述上下文信息,决定音效添加适用于所述至少一个触发词;
从音效库中选择与所述至少一个触发词相对应的音效;以及
将所述音效整合到所述音频文件中。
2.如权利要求1所述的方法,其中,所述至少一个触发词包括以下至少之一:拟声词、场景词、动作词和角色词。
3.如权利要求1所述的方法,其中,所述识别所述至少一个触发词包括以下至少之一:
基于所述至少一个触发词的词性,从所述文本内容中识别所述至少一个触发词;以及
通过与预定触发词列表进行匹配,从所述文本内容中识别所述至少一个触发词。
4.如权利要求1所述的方法,其中,所述上下文信息包括以下至少之一:
所述至少一个触发词的词性;
所述文本内容中的与所述至少一个触发词相邻的词的词性;
所述文本内容中的与所述至少一个触发词相关联的虚拟词;
所述文本内容中的与所述至少一个触发词相关联的否定词;以及
所述至少一个触发词在所述文本内容中的依存关系。
5.如权利要求1所述的方法,其中,所述决定是通过基于规则的分类模型来执行的,所述基于规则的分类模型基于以下规则中的至少一个规则:
所述至少一个触发词是否在对话中;
所述文本内容中是否存在与所述至少一个触发词相关联的任何虚拟词;
所述文本内容中是否存在与所述至少一个触发词相关联的任何否定词;以及
所述至少一个触发词在所述文本内容中的依存关系是否满足预定标准。
6.如权利要求1所述的方法,其中,所述决定是通过基于特征的分类模型来执行的,所述基于特征的分类模型基于以下特征中的至少一个特征:
所述至少一个触发词的词性;
所述文本内容中的与所述至少一个触发词相邻的词的词性;
所述文本内容中的由所述至少一个触发词指示的事件;
所述文本内容中的与所述至少一个触发词相关联的虚拟词的数量;
所述文本内容中的与所述至少一个触发词相关联的否定词的数量;以及
所述至少一个触发词在所述文本内容中的依存关系。
7.如权利要求1所述的方法,其中,所述选择包括:
从所述文本内容中提取与所述至少一个触发词相关联的至少一个描述性词;以及
基于所述至少一个触发词和所述至少一个描述性词,从所述音效库确定与所述至少一个触发词相对应的音效。
8.如权利要求7所述的方法,其中,所述提取是通过基于规则的提取模型来执行的,所述基于规则的提取模型被配置用于基于以下规则中的至少一个规则来确定所述文本内容中的词是否是描述性词:
所述词是否具有预定词性;
所述词的逆文档频率(IDF)是否高于IDF阈值;以及
所述词与所述至少一个触发词之间的距离是否低于距离阈值。
9.如权利要求7所述的方法,其中,所述提取是通过基于特征的提取模型来执行的,所述基于特征的提取模型被配置用于基于以下特征中的至少一个特征来确定所述文本内容中的词是否是描述性词:
所述词的三元组特征;
所述词的词性;
所述词在所述文本内容中的依存关系;以及
所述词与所述至少一个触发词之间的互信息。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于微软技术许可有限责任公司,未经微软技术许可有限责任公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201980025776.X/1.html,转载请声明来源钻瓜专利网。