[发明专利]一种汉字输入方法和装置有效

专利信息
申请号: 200910261064.6 申请日: 2009-12-17
公开(公告)号: CN102103416A 公开(公告)日: 2011-06-22
发明(设计)人: 蔡衡;董恭谨;李洋 申请(专利权)人: 新浪网技术(中国)有限公司
主分类号: G06F3/023 分类号: G06F3/023
代理公司: 中国商标专利事务所有限公司 11234 代理人: 万学堂
地址: 100080 北京市海淀区*** 国省代码: 北京;11
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 一种 汉字输入 方法 装置
【权利要求书】:

1.一种汉字输入方法,其特征在于,包括:

获取拼音串;

根据词典对所述拼音串进行切分以获得拼音串的拼音子串,所述词典包括词条、词条对应的拼音、词条的出现概率、其它词条出现条件下该词条的出现概率、词性、词性之间的条件概率;

从词典中获取与拼音子串对应的候选词条,以及该候选词条对应的出现概率、其它词条出现条件下该候选词条的出现概率、该候选词条的词性;

根据候选词条的出现概率、其它词条出现条件下该候选词条的出现概率、所述候选词条的词性自左向右计算每一候选词条的权重;

从包括拼音串的最后拼音子串对应的所有候选词条的权重中,找出权重最大的候选词条,并根据该权重最大的候选词条确定所述拼音串对应的各个候选词条,将这些候选词条的组合作为输入结果。

2.根据权利要求1所述的方法,其特征在于,所述根据候选词条的出现概率、所述候选词条条件下其它词条出现的概率、所述候选词条的词性自左向右计算每一候选词条的权重的计算公式如下:

Weight(Ai)=max(Weight(Ai-1)+(a×log(P(Ai|Ai-1))+b×log(P(Ai))+c×log(P(Prop(Ai)|Prop(Ai-1)))))

其中,i=1到M,M为拼音串被切分为单个汉字所对应的拼音子串的数目;Ai代表第i个位置的词条,Weight(Ai)表示词条Ai的权重,a、b、c是常数;P(Ai|Ai-1)是指在词条Ai-1的条件下Ai出现的概率;P(Ai)是词条Ai出现的概率,Prop(A)是词条A的词性;P(Prop(Ai)|Prop(Ai-1))是在Ai-1的词性Prop(Ai-1)出现的条件下Ai的词性Prop(Ai)出现的概率。

3.根据权利要求1所述的方法,其特征在于,所述根据该权重最大的候选词条获得所述拼音串对应的各个候选词条具体包括:

从拼音串去除该权重最大候选词条的拼音子串中,将该拼音子串作为当前拼音串,从包括当前拼音串的最后拼音子串对应的所有候选词条的权重中,找出权重最大的候选词条,直到当前拼音串包括最开始的拼音子串为止,所得到的各个候选词条即为拼音串对应的各个候选词条。

4.一种汉字输入装置,其特征在于,具体包括:

词典,其包括词条、词条对应的拼音、词条的出现概率、其它词条出现条件下该词条的出现概率、词性、词性之间的条件概率;

第一获取单元,用于获取拼音串;

切分单元,用于根据词典对所述拼音串进行切分以获得拼音串的拼音子串;

第二获取单元,用于从词典中获取与拼音子串对应的候选词条,以及该候选词条对应的出现概率、其它词条出现条件下该候选词条的出现概率、该候选词条的词性、词性之间的条件概率;

计算单元,用于根据候选词条的出现概率、其它词条出现条件下该候选词条的出现概率、所述候选词条的词性自左向右计算每一候选词条的权重;

确定单元,用于从包括拼音串的最后拼音子串对应的所有候选词条的权重中,找出权重最大的候选词条,并根据该权重最大的候选词条确定所述拼音串对应的各个候选词条,将这些候选词条的组合作为输入结果。

5.根据权利要求4所述的装置,其特征在于,所述计算单元使用如下公式:

Weight(Ai)=max(Weight(Ai-1)+(a×log(P(Ai|Ai-1))+b×log(P(Ai))+c×log(P(Prop(Ai)|Prop(Ai-1)))))

其中,i=1到M,M为拼音串被切分为单个汉字所对应的拼音子串的数目;Ai代表第i个位置的词条,Weight(Ai)表示词条Ai的权重,a、b、c是常数;P(Ai|Ai-1)是指在词条Ai-1的条件下Ai出现的概率;P(Ai)是词条Ai出现的概率,Prop(A)是词A的词性;P(Prop(Ai)|Prop(Ai-1))是在Ai-1的词性Prop(Ai-1)出现的条件下Ai的词性Prop(Ai)出现的概率。

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于新浪网技术(中国)有限公司,未经新浪网技术(中国)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/200910261064.6/1.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top