[发明专利]声控服务无效
申请号: | 95195841.0 | 申请日: | 1995-10-25 |
公开(公告)号: | CN1164292A | 公开(公告)日: | 1997-11-05 |
发明(设计)人: | D·J·艾特沃特;S·J·怀特提克;F·J·斯凯希尔;A·D·西蒙斯 | 申请(专利权)人: | 英国电讯公司 |
主分类号: | G10L5/06 | 分类号: | G10L5/06 |
代理公司: | 中国专利代理(香港)有限公司 | 代理人: | 王勇,邹光新 |
地址: | 英国英*** | 国省代码: | 暂无信息 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 声控 服务 | ||
本发明涉及使用语音识别的自动声音交互服务,它特别适合,但不仅仅适合,在电话网络上使用。
一个典型的应用是一种查询服务,其中使用者被问及一些问题以引出一些答复,这些答复在由语音识别器识别之后,允许用户访问一个信息库中的一个或多个想要的条目,这种应用的一个例子是一种号码簿查询系统,其中一个查询电话订户的电话号码的用户被要求给出该用户地址的城市名和道路名,以及订户的姓氏。
根据本发明的一个特点,它提供有一个语音识别设备,该设备包括含有要识别的条目和信息的数据存贮,其中信息用于为每个条目定义一个与第一组字表中的一个字的联接和一个与第二组字表中的一个字的联接;语音识别装置;以及可操作的控制装置:
a)用于控制该语音识别装置以便通过参考用于第一组字表的识别信息来识别尽可能多的、满足一个预先确定的与第一接收声音信号相似的标准的第一组字表中的字。
b)在这样的识别的基础上,编辑一个第二组字表中所有字的列表,它们被定义与条目相关联,而条目又被定义与所识别的第一组字表中的字相关联;
c)控制该语音识别装置以便通过参考用于第二组字表的识别信息来识别该列表中的与第二接收声音信号相似的一或多个字。
更可取地,根据第一声音信号的接收该语音识别装置可操作地用于为每个识别的字产生一个它与第一声音信号相似性的度量,而且该控制装置可操作用于为该列表中的每个字产生一个从第一组字表中相关字(也就是说,第一组字表中那些识别出的字,它们同列表中的字具有一个共同的条目)的度量中得到的度量。接着,该语音识别装置基于第二声音信号的接收可操作用于进行对列表中一个或多个字的识别,该识别是按照一个根据为列表中的字所产生的度量来加权的识别过程进行的。
该设备还可以包括一个包含用于第二组字表中所有字的识别数据的存贮器,并且控制装置在列表被编辑之后并在识别该列表中的字之前,可以操作用来在识别数据存储器中标记在其中的那些对应于不在列表中的字的数据项或是那些对应于在列表中的字的数据项,由此,识别装置可以忽视所有那些标记过的或是分别没标记过的字。
另一方面,识别数据可在识别前或是在识别中动态地生成,在列表编辑之后可操作控制装置以便为列表中的每个字生成识别数据。用于动态地生成识别数据的方法不属于本发明的范围,但对那些该领域的技术人员来说则是清楚的。
更可取地,该控制装置可操作用于选择输出那个或那些被定义既与第一字表中识别出的字相关联又与第二字表中识别出的字相关联的条目。
数据的存贮器还可以包含为每个条目定义一个与第三字表中的字相联接的信息,控制装置可操作用于:
d)编辑一个第三字表中所有字的列表,它们均被定义为与条目相连,其中每个条目又被定义为既同一个第一字表中识别出的字相连又同一个第二字表中识别出的字相连;并且
e)控制语音识别装置以便通过参考存贮的用于第三字表的识别信息来识别列表中的与第三接收声音信号相似的一或多个字。
另外,也许还应包括用来存贮至少一个接收的声音信号的装置,该设备被安置用来执行一个附加的识别过程,其中控制装置可操作用于:
a)控制语音识别装置以便通过参考存贮的用于第二字表的识别信息来识别符合一个预定的与第二接收声音信号相似的标准的第二字表中的多个字;
b)编辑一个第一字表中所有字的附加列表,它们被定义为与条目相连,这些条目又被定义为与第二字表中识别出的字相连;
c)控制语音识别装置以便通过参考存贮的用于第一字表的识别信息来识别所说的附加列表中相似于第一接收声音信号的一或多个字。
更可取地,该设备包括用于识别一种失败的情况并只在这种失败被识别到时初始化所说的附加识别过程的装置。
该设备可以包括一个电话线路联接;一个用于识别通过电话线路联接所接收到的讲述的字的语音识别器,识别是参考代表一组可能的发音的识别数据进行的;以及响应于通过电话线路联接接收到的表明一个电话的起始和目的端的信号的装置,用来访问所存贮的用于确定发音集合的一个子集的信息并限制识别器只对那个子集操作。
根据本发明的一个进一步的特点,一个电话设备包括一个电话线路联接;一个用于确定或确认通过该电话线路联接所收到的讲述字的说话人身份的语音识别器,它是参考对应于一组可能的说话人的识别数据进行的;以及响应于通过该电话线路联接接收到的表明一个电话的起始端和目的端的信号的装置,用来访问所存贮的用于确定说话人集合的一个子集的信息并限制识别器只对那个子集操作。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于英国电讯公司,未经英国电讯公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/95195841.0/2.html,转载请声明来源钻瓜专利网。