[发明专利]上下文语音查询扩大方法和系统有效
申请号: | 201310174325.7 | 申请日: | 2013-05-13 |
公开(公告)号: | CN103425727B | 公开(公告)日: | 2017-12-12 |
发明(设计)人: | N·拉伊布;K·什里瓦斯塔瓦 | 申请(专利权)人: | 国际商业机器公司 |
主分类号: | G06F17/30 | 分类号: | G06F17/30 |
代理公司: | 北京市中咨律师事务所11247 | 代理人: | 张亚非,于静 |
地址: | 美国*** | 国省代码: | 暂无信息 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 上下文 语音 查询 扩大 方法 系统 | ||
技术领域
本发明的实施例一般地涉及信息技术。更具体地说,本发明涉及语音Web搜索。
背景技术
语音Web搜索涉及将语音查询作为输入并判定作为对查询的适合或相关响应的内容。但是在使用现有方法时,由于例如语音识别系统质量和/或精确性等方面的因素,将语音查询转换为文本可能会引发歧义。如果查询转换不准确,搜索结果会变得不正确。此外,许多现有语音识别系统的语音查询精确性很低,尤其是对于无法实施语法句法的开放式查询和孤立词。
因此,需要改进的语音Web搜索技术。
发明内容
在本发明的一方面,提供了用于上下文语音查询扩大的技术。一种用于在语音Web搜索中的上下文语音查询扩大的示例性计算机实现的方法包括以下步骤:判定创建语音查询的上下文,根据所述上下文以及语音识别组件得出的与所述语音查询相关的信息产生多个查询词的集合,以及使用至少一个扩大算子(operator)处理所述查询词集合以产生扩大的查询集合。
在本发明的另一方面,还提供了针对语音查询执行搜索的技术,包括以下步骤:根据处理语音查询的语音识别组件得出的信息产生多个查询词的集合;使用多个扩大算子处理所述查询词的集合以产生多个扩大的查询词子集;从每个扩大的子集选择至少一个查询词以构成查询集合;以及针对所述查询集合执行搜索。
本发明的另一方面或其元素可以通过有形地包含计算机可读指令的制造品的形式实现,所述计算机可读指令当被实现时,可使计算机执行这里所述的多个方法步骤。此外,本发明的另一方面或其元素可以通过装置的形式实现,所述装置包括存储器和至少一个与所述存储器相连并可操作以执行所述方法步骤的处理器。
更进一步地,本发明的另一方面或其元素可以通过执行此处描述的方法步骤或其元素的装置的形式实现;所述装置可以包括:(i)硬件模块,(ii)软件模块,或(iii)硬件和软件模块的组合;(i)-(iii)中的任一项实现此处描述的具体技术,并且所述软件模块存储在有形计算机可读存储介质(或多个此类介质)中。
通过结合附图阅读下面对本发明的示例性实施例的详细描述,本发明的这些和其它目标、特征和优点将变得显而易见。
附图说明
图1是示出根据本发明的实施例的系统体系结构的图;
图2是示出根据本发明的实施例的扩大机制的图;
图3是示出根据本发明的实施例用于在语音Web搜索中的上下文语音查询扩大的技术的流程图;
图4是上面可实现本发明的至少一个实施例的示例性计算机系统的系统图。
具体实施方式
如此处描述的那样,本发明的一方面包括上下文语音查询扩大以改进语音Web搜索。本发明的至少一个实施例包括判定创建语音查询的上下文以及使用该上下文和对语音识别组件的了解产生多个语音查询。具有大量查询将便利获取更多搜索结果并增加产生用户感兴趣结果的可能性。
如此处所述,本发明的至少一个实施例包括通过指定产生查询的多个可能变形且因此根据查询词或短语创建查询向量估计的机制来消除搜索对一个查询词识别的依赖。因此,在给定查询q的情况下,此处详细描述的技术可以包括产生对查询向量{q’1,q’2,...,q’L}的估计。
本发明的至少一个实施例包括通过语音识别器产生相似(此处称为n最佳)结果列表,由于语音识别器提供一种概率性输出,因此其可被配置为提供一个以上可能结果。n最佳列表指语音识别器可针对给定语音输入提供的n个可能文本结果。在本发明的至少一个实施例中,这样的列表可以用每个可能结果是正确响应的概率分数进行排列。此外,这样的列表可以通过扩大算子进行过滤,下面将进一步描述。如果输出结果较少(例如,如果结果为三个或更少),则本发明的至少一个实施例包括判定扩大算子词与n最佳列表匹配之间的编辑距离(edit-distance)。
此外,结果列表或子集可从每个扩大过滤器的输出进行选择并用于组成查询集合。例如,每个扩大算子可以产生可能的查询词,并且可以根据阈值选择每个此类扩大算子的前k个输出以跨所有扩大算子组成查询集合。可以针对此查询集合执行搜索,且在本发明的至少一个实施例中,可对结果进行排列以便在扩大输出的更多元素中出现的结果排序更高。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于国际商业机器公司,未经国际商业机器公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201310174325.7/2.html,转载请声明来源钻瓜专利网。
- 上一篇:控制系统、控制装置及程序执行控制方法
- 下一篇:检索装置和检索方法