[发明专利]一种汉字输入方法和装置有效
申请号: | 200910261064.6 | 申请日: | 2009-12-17 |
公开(公告)号: | CN102103416A | 公开(公告)日: | 2011-06-22 |
发明(设计)人: | 蔡衡;董恭谨;李洋 | 申请(专利权)人: | 新浪网技术(中国)有限公司 |
主分类号: | G06F3/023 | 分类号: | G06F3/023 |
代理公司: | 中国商标专利事务所有限公司 11234 | 代理人: | 万学堂 |
地址: | 100080 北京市海淀区*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 汉字输入 方法 装置 | ||
1.一种汉字输入方法,其特征在于,包括:
获取拼音串;
根据词典对所述拼音串进行切分以获得拼音串的拼音子串,所述词典包括词条、词条对应的拼音、词条的出现概率、其它词条出现条件下该词条的出现概率、词性、词性之间的条件概率;
从词典中获取与拼音子串对应的候选词条,以及该候选词条对应的出现概率、其它词条出现条件下该候选词条的出现概率、该候选词条的词性;
根据候选词条的出现概率、其它词条出现条件下该候选词条的出现概率、所述候选词条的词性自左向右计算每一候选词条的权重;
从包括拼音串的最后拼音子串对应的所有候选词条的权重中,找出权重最大的候选词条,并根据该权重最大的候选词条确定所述拼音串对应的各个候选词条,将这些候选词条的组合作为输入结果。
2.根据权利要求1所述的方法,其特征在于,所述根据候选词条的出现概率、所述候选词条条件下其它词条出现的概率、所述候选词条的词性自左向右计算每一候选词条的权重的计算公式如下:
Weight(Ai)=max(Weight(Ai-1)+(a×log(P(Ai|Ai-1))+b×log(P(Ai))+c×log(P(Prop(Ai)|Prop(Ai-1)))))
其中,i=1到M,M为拼音串被切分为单个汉字所对应的拼音子串的数目;Ai代表第i个位置的词条,Weight(Ai)表示词条Ai的权重,a、b、c是常数;P(Ai|Ai-1)是指在词条Ai-1的条件下Ai出现的概率;P(Ai)是词条Ai出现的概率,Prop(A)是词条A的词性;P(Prop(Ai)|Prop(Ai-1))是在Ai-1的词性Prop(Ai-1)出现的条件下Ai的词性Prop(Ai)出现的概率。
3.根据权利要求1所述的方法,其特征在于,所述根据该权重最大的候选词条获得所述拼音串对应的各个候选词条具体包括:
从拼音串去除该权重最大候选词条的拼音子串中,将该拼音子串作为当前拼音串,从包括当前拼音串的最后拼音子串对应的所有候选词条的权重中,找出权重最大的候选词条,直到当前拼音串包括最开始的拼音子串为止,所得到的各个候选词条即为拼音串对应的各个候选词条。
4.一种汉字输入装置,其特征在于,具体包括:
词典,其包括词条、词条对应的拼音、词条的出现概率、其它词条出现条件下该词条的出现概率、词性、词性之间的条件概率;
第一获取单元,用于获取拼音串;
切分单元,用于根据词典对所述拼音串进行切分以获得拼音串的拼音子串;
第二获取单元,用于从词典中获取与拼音子串对应的候选词条,以及该候选词条对应的出现概率、其它词条出现条件下该候选词条的出现概率、该候选词条的词性、词性之间的条件概率;
计算单元,用于根据候选词条的出现概率、其它词条出现条件下该候选词条的出现概率、所述候选词条的词性自左向右计算每一候选词条的权重;
确定单元,用于从包括拼音串的最后拼音子串对应的所有候选词条的权重中,找出权重最大的候选词条,并根据该权重最大的候选词条确定所述拼音串对应的各个候选词条,将这些候选词条的组合作为输入结果。
5.根据权利要求4所述的装置,其特征在于,所述计算单元使用如下公式:
Weight(Ai)=max(Weight(Ai-1)+(a×log(P(Ai|Ai-1))+b×log(P(Ai))+c×log(P(Prop(Ai)|Prop(Ai-1)))))
其中,i=1到M,M为拼音串被切分为单个汉字所对应的拼音子串的数目;Ai代表第i个位置的词条,Weight(Ai)表示词条Ai的权重,a、b、c是常数;P(Ai|Ai-1)是指在词条Ai-1的条件下Ai出现的概率;P(Ai)是词条Ai出现的概率,Prop(A)是词A的词性;P(Prop(Ai)|Prop(Ai-1))是在Ai-1的词性Prop(Ai-1)出现的条件下Ai的词性Prop(Ai)出现的概率。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于新浪网技术(中国)有限公司,未经新浪网技术(中国)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/200910261064.6/1.html,转载请声明来源钻瓜专利网。