[发明专利]表征、选择以及调整用于自动语音识别系统的音频和声学训练数据在审
申请号: | 201780032505.8 | 申请日: | 2017-03-27 |
公开(公告)号: | CN109313893A | 公开(公告)日: | 2019-02-05 |
发明(设计)人: | D·夏尔马;P·内勒;U·H·约斯特 | 申请(专利权)人: | 纽昂斯通讯公司 |
主分类号: | G10L15/065 | 分类号: | G10L15/065;G10L21/003;G10L15/20 |
代理公司: | 北京三友知识产权代理有限公司 11127 | 代理人: | 黄纶伟;李辉 |
地址: | 美国马*** | 国省代码: | 美国;US |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 表征目标应用声学域的系统和方法分析来自于目标应用声学域的一个或更多个语音数据样本,以确定一个或更多个目标声学特性,该一个或更多个目标声学特性包括与语音数据样本相关联的编解码器类型和比特率。所确定的目标声学特性还可以包括目标语音数据样本的其它方面,诸如采样频率、有效带宽、噪声级、混响级、限幅级和语速。将所确定的目标声学特性作为目标声学数据简档存储在存储器中。数据简档可以被用来基于一个或更多个目标声学特性而选择和/或修改一个或更多个域外语音样本。 | ||
搜索关键词: | 多个目标 声学特性 目标声学特性 语音数据样本 自动语音识别系统 编解码器类型 存储器 表征目标 采样频率 方法分析 简档存储 目标应用 目标语音 声学数据 数据简档 数据样本 训练数据 应用声学 有效带宽 语音样本 比特率 和声学 限幅级 噪声级 声学 混响 关联 | ||
【主权项】:
1.一种用于确定应用目标域(ATD)的音频和声学特性的系统,该系统包括:处理器;以及存储有计算机代码指令的存储器,所述存储器在工作时连接到所述处理器,以便所述计算机代码指令使得所述处理器执行下列步骤:分析来自于所述ATD的一个或更多个语音数据样本,以确定包括下列项中的一个或更多个的一个或更多个目标音频和声学特性:(a)编解码器类型;(b)与所述一个或更多个语音数据样本相关联的比特率;(c)与所述语音数据样本相关联的采样频率;(d)与所述语音数据样本相关联的有效带宽;(e)与所述语音数据样本相关联的噪声级;(f)与所述语音数据样本相关联的混响级;(g)与所述语音数据样本相关联的限幅级;(f)与所述语音数据样本相关联的语速;以及将所述一个或更多个目标音频和声学特性作为目标数据简档存储在所述存储器中。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于纽昂斯通讯公司,未经纽昂斯通讯公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201780032505.8/,转载请声明来源钻瓜专利网。
- 上一篇:用于语音合成的系统和方法
- 下一篇:信息处理装置与信息处理方法