[发明专利]动态创建语境的方法和系统无效
申请号: | 200680046095.4 | 申请日: | 2006-12-07 |
公开(公告)号: | CN101326573A | 公开(公告)日: | 2008-12-17 |
发明(设计)人: | G·格罗鲍尔;M·帕保伊 | 申请(专利权)人: | 皇家飞利浦电子股份有限公司 |
主分类号: | G10L15/18 | 分类号: | G10L15/18;G06F19/00 |
代理公司: | 永新专利商标代理有限公司 | 代理人: | 宋献涛;王英 |
地址: | 荷兰艾*** | 国省代码: | 荷兰;NL |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 动态 创建 语境 方法 系统 | ||
技术领域
概括地说,本发明涉及语音识别领域。具体地说,本发明涉及动态创建特定语境的方法和系统。
背景技术
现今,语音识别(SR)系统在许多产业内变得日益有效并得到很好地运用。采用语音识别处理,计算机把麦克风接收到的声学信号转换成包括一组单词的文档。然后,这些识别出的单词可以在用于不同目的的各种应用中使用。把语音转换成文本的自动语音识别系统需要实现成本低、效率高的文档创建和高转写效率。
但是,事实是:由语音识别创建的文档随后仍需要由作者、转写员、质保(QA)人员或其他人员手工或口述修改文档而得以校对或审核,这增加了这些语音识别系统的复杂性。
在过去的一些年里,已经提出了一些提高语音识别准确度的思想。出版物WO 2005/052785举例说明了如何使用文档结构知识进行更加有效的文档创建。一种框架用于检测并处理文档的逻辑结构,以生成语音已启动的文档。
已知的是,使用单个语音识别器配置,统一用于具有例如声学基准、语言模型、词典或字典以及语法规则的恒定集的整个文档。在这种情况下,数据可能太过泛泛或太大,例如所有潜在主题的超集,这会降低识别率,并且,没有用于调整配置的动态方法。
还已知的是,对于文档的每个段落或部分,使用一组有限的局部静态配置、语境,例如特定词典、语言模型以及文档特定语法等。在这些情况下,通常难以确定各种配置,并难以将它们映射到文档部分。特定局部配置的创建也是一项非常耗时的处理,因为语境创建涉及对通常包括数百万个单词的词库进行处理。
例如,在医学口述系统中,已知的是,当医生口述诸如脊柱X-光报告之类的报告时,语音识别系统使用普通放射线学配置,即放射线学语境,它包括专用于放射线学的词典、语言模型和语法。但是,放射线学领域仍然是很广阔的,并且,由于误识会识别出不正确的单词,其(例如,视网膜)可能与特定主题(例如,脊柱)完全不相关。因此,就所使用的词典或特定词汇量而论,这些系统提供的语境仍然是静态的,并缺乏准确性或专业性。通常,语境过于概括,并且,与在特定文档区域所需要的单词和句子相比,它支持更多的单词和句子。因此,将需要着重强调那些在特定文档区域中确实需要的单词和句子,即语境的子集。
因此,为了降低语音识别系统差错率,静态度较小的且具有较好和较窄的语境自适应的改进系统将是有益的。
发明内容
因此,本发明至少部分地通过提供根据所附的权利要求书所述的用于动态创建特定语境的系统和方法,以单独或以任何组合方式减少、削弱或消除本领域中的一个或多个以上缺陷和缺点,并解决至少上述问题。
更具体地说,本发明涉及从文本文档中提取结构和内容信息(例如标题、标签等)的语音识别系统,并使用它来改善语音识别。针对文本文档部分自动创建或生成特定语境,例如词典、语法和语言模型。
根据本发明的一方面,提供了包括电子文档的语音识别系统所用的一种方法,所述电子文档是基于语音的文档,其包括根据语音段识别或转写出来的一个或多个文本段。语音段由作者口述,并由语音识别系统中的语音识别器处理成基于语音的文档的相应文本段。所述方法包括由语音识别器动态创建和/或修改子语境,并使子语境与文本段相关联。所述方法还可以包括以下步骤:识别与电子文档相关的基本主题;使基本语境与电子文档相关联,所述基本语境包括至少一组单词以及与基本主题相关的该组单词的用法;识别子主题,每个子主题都与电子文档里的一个特定文本段相关;根据基本语境创建子语境,所述子语境分别包括至少一组特定单词和与子主题相关的该组特定单词的用法;使每个子语境与电子文档里的一个匹配文本段相关联。此外,所述方法可以包括自动执行以下步骤:给每个文本段创建子语境;修改所述电子文档里的所述子语境。此外,所述方法可以包括根据所述基本语境创建所述子语境,其包括:识别与电子文档的剩余部分不同的与特定文本段有关的单词;使用基本语境创建该组特定单词。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于皇家飞利浦电子股份有限公司,未经皇家飞利浦电子股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/200680046095.4/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种取向三氧化钨纳米薄膜的制备方法
- 下一篇:多速变速器