[发明专利]一种语音分析的系统和方法在审
申请号: | 202010106462.7 | 申请日: | 2020-02-21 |
公开(公告)号: | CN111739556A | 公开(公告)日: | 2020-10-02 |
发明(设计)人: | 屈华民;陈远哲;傅四维;袁林萍;伍翱宇 | 申请(专利权)人: | 蓝星球培训 |
主分类号: | G10L25/51 | 分类号: | G10L25/51;G10L25/69;G06F16/64;G06F16/683;G10L19/02 |
代理公司: | 深圳尚业知识产权代理事务所(普通合伙) 44503 | 代理人: | 文蓉 |
地址: | 美国新泽西州蒙*** | 国省代码: | 暂无信息 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 语音 分析 系统 方法 | ||
提供了一种用于处理音频信号的计算机实现的方法和系统。该方法包括从音频信号中提取韵律特征、利用源自音频信号或与音频信号相关联的脚本将提取的韵律特征校准、以及利用所述校准的提取的韵律特征将脚本分割成第一类型的结构块的步骤。该方法可以包括使用例如Damerau‑Levenshtein距离来确定源自脚本的第一类型的结构块与第一类型的另一结构块之间的距离测度。
技术领域
本发明涉及用于处理音频信号的系统和方法,更具体地,涉及用于分析和/或可视化音频语音剪辑的系统和方法。
背景技术
尽管发表公开讲话变得越来越重要,但对大多数人来说,这仍然是一项具有挑战性的任务,因为它需要各种技能。其中一个主要挑战是,特别是对于非母语人士而言,难以对讲话进行有效和引人入胜的叙述(这已被证明对听众参与度有重要影响)。
好的叙述要求说话者使用适当的韵律,即包括音调、强度、语速、停顿等在内的语音旋律来表达性地传达信息。近年来已经提出了许多系统来帮助说话者分析他们的叙述表现。一些工作旨在在排练期间向说话者提供即时反馈,而另一些工作总结说话者的表现,例如语音调制以支持自我反省。最近,某些系统被提议通过再合成技术来修改说话者的录音,该技术允许说话者听到他们如何能够更好地说话。尽管这些系统成功地促进了说话者对其在演示中的语音状态的认识,但是它们也具有局限性。首先,一些工作要求说话者重复地听他们的录音和改进的录音,这是低效的并且容易使用户感到沮丧。其次,因为一次好的演讲可以用不同的风格来表达,所以最好允许用户探索和定制他们想要模仿的叙述风格。
近年来出现了越来越多的数字化语音数据,例如TED演讲,它提供了丰富的优秀叙述策略的样本。虽然许多人认为这是对更好的语音叙述的参考,但很难识别想要的叙述策略的具体样本。首先,TED演讲包括目前超过2900个演讲的大规模数据集,这使得人们通过观看所有演讲来容易地搜索合适的样本变得极其困难(假设不是不切实际的话)。其次,即使他们只专注于一次演讲,也很难注意到有用的策略,因为它们可能会被快速说出的成千上万个单词所淹没。
因此,想要一种使用数据驱动方法的公开讲话探索系统。为了实现这一点,提供一种改进的音频信号处理系统和方法是有利的。
发明内容
本发明的目的是在某种程度上减轻或消除与已知的公开讲话探索系统和/或已知的音频信号处理系统相关联的一个或多个问题。
上述目的通过独立权利要求的特征的组合来实现;从属权利要求公开了本发明的进一步有利的实施例。
本发明的另一个目的是提供一种数据驱动的公开讲话探索系统。
本发明的另一目的是提供一种利用相关联的脚本来分析和/或处理音频信号的改进方法。
本发明的又一目的是提供一种利用相关联的脚本使音频信号可视化的改进方法。
本领域技术人员将从以下描述中得出本发明的其它目的。因此,上述目的陈述并非穷举性的,而仅用于说明本发明的许多目的中的一些目的。
本发明大体上涉及一种可视化分析系统,其允许用户理解高质量语音样本中的良好韵律模式,并因此发现良好的叙述策略。在一个实施例中,本发明首先提取每个语音的韵律特征并用脚本校准这些特征。然后,优选地构建并可视化地呈现三级层次结构,即语音级、句子级和单词级。该系统可以包括四个关联的视图和丰富的交互,以促进该三级细节分析。
在第一主要方面,本发明提供了一种处理音频信号的计算机实现的方法,包括以下步骤:从音频信号中提取韵律特征;利用源自所述音频信号或与所述音频信号相关联的脚本将提取的韵律特征校准;以及利用所述校准的提取的韵律特征将所述脚本分割成第一类型的结构块。优选地,音频信号包括人类语音的数字音频剪辑,但是可以包括合成语音,例如,由计算机合成器应用程序从文本生成的语音。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于蓝星球培训,未经蓝星球培训许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010106462.7/2.html,转载请声明来源钻瓜专利网。
- 上一篇:评价装置
- 下一篇:真无线耳机及其敲击实现操作控制的方法、装置和系统