[发明专利]用于消除语言转换中的多个读法的歧义的方法有效

专利信息
申请号: 201210287345.0 申请日: 2012-08-13
公开(公告)号: CN102982021A 公开(公告)日: 2013-03-20
发明(设计)人: 布伦特·D·拉梅尔斯;戴王·K·奈克;道格拉斯·R·戴维森;亚内斯·G·A·多尔芬;朴佳 申请(专利权)人: 苹果公司
主分类号: G06F17/28 分类号: G06F17/28;G06F17/30
代理公司: 北京律盟知识产权代理有限责任公司 11287 代理人: 刘国伟
地址: 美国加利*** 国省代码: 美国;US
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 用于 消除 语言 转换 中的 读法 歧义 方法
【权利要求书】:

1.一种方法,其包括:

在包括存储器和一个或一个以上处理器的装置处:

接收待转换成一组字符的输入数据,所述组字符包括所述输入数据在目标符号系统中的符号表示;以及

使用区别所述目标符号系统的同形异音异义字符的第一读法与第二读法的语言模型,以确定所述同形异音异义字符表示所述输入数据的对应部分的相应概率。

2.根据权利要求1所述的方法,其进一步包括:

在待将所述输入数据转换到的所述目标符号系统中产生一个或一个以上转换候选者。

3.根据权利要求1到2中任一权利要求所述的方法,其中所述输入数据包括以拼音书写的输入文本。

4.根据权利要求1到3中任一权利要求所述的方法,其中所述输入数据包括以罗马字母表的字符书写的输入文本。

5.根据权利要求1到4中任一权利要求所述的方法,其中将所述输入数据解析成一个或一个以上单音节字符群组。

6.根据权利要求1到5中任一权利要求所述的方法,其中所述目标符号系统包含中文字符。

7.根据权利要求1到6中任一权利要求所述的方法,其中使用已加以注释以区别所述同形异音异义字符的所述第一读法与所述同形异音异义字符的所述第二读法的语料库来训练所述语言模型,且其中对于所述同形异音异义字符的所述第一读法和所述第二读法中的至少一者,建立对应新符号或其经编码表示并将所述对应新符号或其经编码表示添加到所述已加以注释的语料库。

8.根据权利要求1到7中任一权利要求所述的方法,其进一步包括:

接收对与语料库相关联的文本子集的注释的一个或一个以上手动输入,其中对于相应同形异音异义字符的例子,对注释的每一所述手动输入至少部分基于与所述例子相关联的上下文而指示所述相应同形异音异义字符的相应适当读法,其中每一所述注释与相关联于所述相应同形异音异义字符的相应符号相关联;以及

至少部分基于对注释的所述所接收的一个或一个以上手动输入,自动地对与所述语料库相关联的所述文本的未加以手动地注释的至少一部分加以注释。

9.根据权利要求1到8中任一权利要求所述的方法,其中训练所述语言模型以使对应于所述同形异音异义字符的所述第一读法的第一概率与对应于所述同形异音异义字符的所述第二读法的第二概率相关联。

10.根据权利要求1到9中任一权利要求所述的方法,其中训练所述语言模型以使对应于第一字符序列的第一概率与对应于第二字符序列的第二概率相关联,所述第一字符序列包含所述同形异音异义字符的所述第一读法,所述第二字符序列包含所述同形异音异义字符的所述第二读法,其中所述第一序列与所述第二序列各自包含两个或两个以上字符。

11.一种电子装置,其包括:

输入接收单元,其经配置以接收待转换成一组字符的输入数据,所述组字符包括所述输入数据在目标符号系统中的符号表示;以及

耦合到所述输入接收单元的转换单元,所述转换单元经配置以使用区别所述目标符号系统的同形异音异义字符的第一读法与第二读法的语言模型,以确定所述同形异音异义字符表示所述输入数据的对应部分的相应概率。

12.根据权利要求11所述的电子装置,其中所述转换单元经进一步配置以在待将所述输入数据转换到的所述目标符号系统中产生一个或一个以上转换候选者。

13.根据权利要求11到12中任一权利要求所述的电子装置,其中所述输入数据包括以拼音书写的输入文本。

14.根据权利要求11到13中任一权利要求所述的电子装置,其中所述输入数据包括以罗马字母表的字符书写的输入文本。

15.根据权利要求11到14中任一权利要求所述的电子装置,其中所述输入数据被解析成一个或一个以上单音节字符群组。

16.根据权利要求11到15中任一权利要求所述的电子装置,其中所述目标符号系统包含中文字符。

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于苹果公司,未经苹果公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/201210287345.0/1.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top