[发明专利]语音处理系统和方法有效

专利信息
申请号: 201680076211.0 申请日: 2016-11-04
公开(公告)号: CN108496219B 公开(公告)日: 2022-12-30
发明(设计)人: 托马斯·威廉·约翰·ASH;安东尼·约翰·罗宾逊 申请(专利权)人: 剑桥大学的校长;教师和学者
主分类号: G10L15/193 分类号: G10L15/193;G10L25/51;G09B19/06;G10L25/78;G10L15/187
代理公司: 广州三环专利商标代理有限公司 44202 代理人: 郝传鑫;熊永强
地址: 英国剑桥*** 国省代码: 暂无信息
权利要求书: 查看更多 说明书: 查看更多
摘要: 在一实施例中,提供了一种语音处理系统,其包括一输入,用于接收一用户所说的输入话语;以及一单词对齐单元,被配置为将声学语音模型的不同序列与用户所说的输入话语对齐,声学语音模型的每个不同序列对应于用户可能说出的一种不同可能话语并且标识:朗读提示文本中用户跳过的任何部分;所述朗读提示文本中用户重复的任何部分;以及所述朗读提示文本中用户在的单词之间插入的任何语音。来自所述单词对齐单元的信息可用于评估用户讲话的熟练度和/或流畅性。
搜索关键词: 语音 处理 系统 方法
【主权项】:
1.一种语音处理系统,包括:一输入,用于接收一用户响应一朗读提示文本而说出的一输入话语;一声学模型存储器,存储声学语音模型;一朗读提示数据存储器,其存储所述朗读提示中标识了单词序列的文本数据;一数据存储器,其存储定义第一网络的数据,所述第一网络具有通过所述第一网络的多个路径,每条路径表示用户响应所述朗读提示文本而可能说出的一种不同可能话语,所述不同路径允许:i)所述用户跳过所述朗读提示文本的部分;ii)所述用户重复所述朗读提示文本的部分或全部;和iii)所述用户在所述朗读提示文本中的单词之间插入语音声音;及一单词对齐单元,被配置为将所述声学语音模型的不同序列与所述用户所说的所述输入话语对齐,声学语音模型的每个不同序列对应该不同可能话语中的一种,所述不同可能话语是用户响应由所述第一网络的一个路径所表示的所述朗读提示文本而做出的,并且输出对齐结果,所述对齐结果标识了:i)来自与所述用户所说的所述输入话语相匹配的由所述第一网络所表示的所有可能话语中的一种匹配可能话语;ii)所述用户跳过的所述朗读提示文本的任何部分;iii)所述用户重复的所述朗读提示文本的任何部分;iv)所述用户在所述朗读提示文本的单词之间插入的任何语音声音;以及v)所述匹配可能话语的单词和子词单元与所述用户所说的所述输入话语之间的时间对齐。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于剑桥大学的校长、教师和学者,未经剑桥大学的校长、教师和学者许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/patent/201680076211.0/,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top