[发明专利]用于将汉语拼音翻译成汉字的系统和方法有效
申请号: | 200580015669.7 | 申请日: | 2005-03-16 |
公开(公告)号: | CN1954315A | 公开(公告)日: | 2007-04-25 |
发明(设计)人: | 吴军;朱会灿;朱鸿隽 | 申请(专利权)人: | GOOGLE公司 |
主分类号: | G06F17/28 | 分类号: | G06F17/28 |
代理公司: | 北京康信知识产权代理有限责任公司 | 代理人: | 余刚 |
地址: | 美国加利*** | 国省代码: | 美国;US |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明披露了一种用于将拼音处理并翻译成汉字和词的系统和方法。通过以下处理训练汉语语言模型:从诸如文件和/或用户输入/查询的汉语输入中提取未知字符串;从未知字符串中确定有效词;以及基于汉语输入生成用于预测给定语境的词串的转换矩阵。用于翻译拼音输入的方法通常包括:使用包括从汉语输入得到的词的汉语字典和基于汉语输入训练的语言模型从拼音输入生成一组汉字符串,每个字符串均具有表示字符串对应于拼音输入的可能性的权重。可以通过识别用户输入中的不确定的拼音/非拼音ASC II词以及分析语境以分类用户输入,来将不确定的用户输入分类成非拼音或拼音。 | ||
搜索关键词: | 用于 汉语拼音 译成 汉字 系统 方法 | ||
【主权项】:
1.一种用于从汉语输入训练汉语语言模型的方法,包括:从一组汉语输入中提取未知字符串;通过比较所述未知字符串的出现频率与所述未知字符串中单个字符的出现频率,从所述未知字符串确定有效词;以及生成用于预测给定语境的词的条件概率的转换矩阵。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于GOOGLE公司,未经GOOGLE公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/200580015669.7/,转载请声明来源钻瓜专利网。
- 上一篇:双防电缆保护套及插头套
- 下一篇:由通关藤、人参和黄芪制成的药物组合物