[发明专利]语音处理系统和方法有效
申请号: | 201680076211.0 | 申请日: | 2016-11-04 |
公开(公告)号: | CN108496219B | 公开(公告)日: | 2022-12-30 |
发明(设计)人: | 托马斯·威廉·约翰·ASH;安东尼·约翰·罗宾逊 | 申请(专利权)人: | 剑桥大学的校长;教师和学者 |
主分类号: | G10L15/193 | 分类号: | G10L15/193;G10L25/51;G09B19/06;G10L25/78;G10L15/187 |
代理公司: | 广州三环专利商标代理有限公司 44202 | 代理人: | 郝传鑫;熊永强 |
地址: | 英国剑桥*** | 国省代码: | 暂无信息 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 在一实施例中,提供了一种语音处理系统,其包括一输入,用于接收一用户所说的输入话语;以及一单词对齐单元,被配置为将声学语音模型的不同序列与用户所说的输入话语对齐,声学语音模型的每个不同序列对应于用户可能说出的一种不同可能话语并且标识:朗读提示文本中用户跳过的任何部分;所述朗读提示文本中用户重复的任何部分;以及所述朗读提示文本中用户在的单词之间插入的任何语音。来自所述单词对齐单元的信息可用于评估用户讲话的熟练度和/或流畅性。 | ||
搜索关键词: | 语音 处理 系统 方法 | ||
【主权项】:
1.一种语音处理系统,包括:一输入,用于接收一用户响应一朗读提示文本而说出的一输入话语;一声学模型存储器,存储声学语音模型;一朗读提示数据存储器,其存储所述朗读提示中标识了单词序列的文本数据;一数据存储器,其存储定义第一网络的数据,所述第一网络具有通过所述第一网络的多个路径,每条路径表示用户响应所述朗读提示文本而可能说出的一种不同可能话语,所述不同路径允许:i)所述用户跳过所述朗读提示文本的部分;ii)所述用户重复所述朗读提示文本的部分或全部;和iii)所述用户在所述朗读提示文本中的单词之间插入语音声音;及一单词对齐单元,被配置为将所述声学语音模型的不同序列与所述用户所说的所述输入话语对齐,声学语音模型的每个不同序列对应该不同可能话语中的一种,所述不同可能话语是用户响应由所述第一网络的一个路径所表示的所述朗读提示文本而做出的,并且输出对齐结果,所述对齐结果标识了:i)来自与所述用户所说的所述输入话语相匹配的由所述第一网络所表示的所有可能话语中的一种匹配可能话语;ii)所述用户跳过的所述朗读提示文本的任何部分;iii)所述用户重复的所述朗读提示文本的任何部分;iv)所述用户在所述朗读提示文本的单词之间插入的任何语音声音;以及v)所述匹配可能话语的单词和子词单元与所述用户所说的所述输入话语之间的时间对齐。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于剑桥大学的校长、教师和学者,未经剑桥大学的校长、教师和学者许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201680076211.0/,转载请声明来源钻瓜专利网。
- 上一篇:多显示器设备以及用于控制多显示器设备的方法
- 下一篇:自适应量化