[发明专利]用于统计语言模型的自适应有效

专利信息
申请号: 201080015801.5 申请日: 2010-03-26
公开(公告)号: CN102369567A 公开(公告)日: 2012-03-07
发明(设计)人: 大附克年;梅冈孝史 申请(专利权)人: 微软公司
主分类号: G10L15/06 分类号: G10L15/06;G10L15/00
代理公司: 上海专利商标事务所有限公司 31100 代理人: 蔡悦
地址: 美国华*** 国省代码: 美国;US
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 用于 统计 语言 模型 自适应
【说明书】:

背景技术

对于诸如例如汉语、韩语以及日语之类的东亚语言,可以使用输入法来将语音字符串转换(读取)为显示字符,还处理诸如繁体中文字符之类中的笔画。由于同音词以及各种可能的单词分段,转换中存在歧义。输入法试图基于一般(例如,基准、默认)语言模型以及用户输入历史来解决歧义。可以以多种方式执行对用户输入历史的自适应,例如,短期记忆以及长期记忆。短期记忆对应于自适应的快速性,而长期记忆对应于自适应的稳定性。通过将来自短期和长期记忆的信息添加到通用语言模型中,来确定转换结果。

可以通过基于以前的用户对单词的选择(用户输入历史)来增加单词分数或改变单词分级来实现短期记忆。然而,一些单词在被使用之后不会很快出现,而一些单词在被使用之后意外地在无法接受的上下文中出现。长期记忆可以通过累加用户输入历史来实现。然而,一些单词仍意外地出现在无法接受的上下文中,尽管使用了长期记忆。

发明内容

下面提供了简明的概述,以便提供对此处所描述的一些新颖实施方式的基准理解。本概述不是详尽的概述,并且它不旨在标识关键/重要元素或描绘本发明的范围。其唯一的目的是以简化形式呈现一些概念,作为稍后呈现的更具体实施方式的序言。

所公开的体系结构通过将适当的限制应用到长期和短期记忆来抑制单词的意外出现。还通过利用限制来实现自适应的快速性。

该体系结构包括历史组件,用于处理通过输出转换结果的转换过程对语音字符串的转换的用户输入历史,以及自适应组件,用于基于应用于在转换过程中影响单词出现的短期记忆的限制来使转换过程适应用户输入历史。该体系结构基于依赖于上下文的概率差(短期记忆)来执行概率增加,并基于单词的前面的上下文的频率(长期记忆)在长期记忆和基准语言模型之间执行动态线性内插。

为了为实现上述及相关目的,本文结合下面的描述和附图来描述某些说明性方面。这些方面指示了可以实施本文所公开的原理的各种方式,所有方面及其等效方面旨在落入所要求保护的主题的范围内。结合附图阅读下面的具体实施方式,其他优点和新颖特征将变得显而易见。

附图说明

图1示出了根据所公开的体系结构的计算机实现的语音系统。

图2示出了包括图1的语音系统的附加的方面的系统。

图3示出了权重变换的图。

图4示出了缓存权重变换的图。

图5示出了计算机实现的语音方法。

图6示出了图5的方法的附加的方面。

图7示出了图5的方法的附加的方面。

图8示出了根据所公开的体系结构的可操作以执行对于统计语言模型的快速而稳定的自适应的计算系统的框图。

具体实施方式

虽然现有的语音系统的转换精度在一般方案中可以是高的,但是,用户仍失望,因为特定用户的语言空间不同于通用空间。特别是对于人名,就是这种情况,表达式首选项随着用户自然地变化,因此,无法通过通用语言模型来解决。

所公开的体系结构是自动调谐技术,其中,在使用产品较短时间(例如,2-3周)之后,用户不再需要打开候选列表。此外,所公开的自动调谐技术提高了用户的工作绩效。该体系结构基于依赖于上下文的概率差(短期记忆)执行概率增强,并基于单词的前面的上下文的频率(长期记忆)在长期记忆和基准语言模型之间执行动态线性内插。

现在将参考附图,全部附图中相同的参考编号用于表示相同的元件。在下面的描述中,为了进行说明,阐述了很多具体细节以便提供对本发明的全面理解。然而,显而易见,可以没有这些具体细节的情况下实施各新颖实施方式。在其他情况下,以框图形式示出了各个公知的结构和设备以便于描述本发明。本发明将涵盖落入所要求保护的主题的精神和范围内的所有修改、等效方案和替换方案。

图1示出了根据所公开的体系结构的计算机实现的语音系统100。系统100包括历史组件102,用于处理通过输出转换结果106的转换过程对语音字符串105的转换的用户输入历史104,以及自适应组件108,用于基于应用于在转换过程中影响单词出现的短期记忆112的限制110而使转换过程适应用户输入历史104。

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于微软公司,未经微软公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/201080015801.5/2.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top