[发明专利]一种语句生成方法及装置有效
申请号: | 201010120044.X | 申请日: | 2010-03-04 |
公开(公告)号: | CN102193639A | 公开(公告)日: | 2011-09-21 |
发明(设计)人: | 薛永刚;陈培军;秦吉胜;侯磊 | 申请(专利权)人: | 阿里巴巴集团控股有限公司 |
主分类号: | G06F3/023 | 分类号: | G06F3/023 |
代理公司: | 北京同达信恒知识产权代理有限公司 11291 | 代理人: | 郭润湘 |
地址: | 英属开曼群岛大开曼*** | 国省代码: | 开曼群岛;KY |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本申请公开了一种语句生成方法及装置,用以解决现有技术中拼音输入法生成的语句准确性低的问题。该方法将拼音流切分后的拼音音节序列中的各拼音音节子序列,与词典中保存的各词条的拼音进行匹配,确定该拼音音节子序列的每个候选词,将每个候选词组成对应的语句,针对每个语句的候选词与该候选词之前或之后的候选词组成的词组,及词典中每个词组对应的权重,确定该候选词对应的分数,根据所述每个语句中每个候选词的分数,确定每个语句的总分数,将总分数最大的语句作为生成的语句。由于只有经常出现的词组对应的权重才会比较高,即经常出现的词组一定是用户经常使用,或满足语言规则的词组,因此采用该方法可以使生成的语句更加的准确。 | ||
搜索关键词: | 一种 语句 生成 方法 装置 | ||
【主权项】:
一种语句生成方法,其特征在于,包括:将用户输入的拼音流切分后获取的拼音音节序列中的各拼音音节子序列,与词典中保存的各词条的拼音进行匹配,将匹配成功的拼音对应的每个词条作为该拼音音节子序列的每个候选词;将每个拼音音节子序列的每个候选词组成对应的语句,针对每个语句的每个候选词,根据该候选词与该候选词之前的候选词组成的词组,及所述词典中每个词组对应的权重,确定该候选词对应的分数;根据所述每个语句中每个候选词的分数,确定所述每个语句的总分数,并根据确定的总分数,将总分数最大的语句作为生成的语句。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于阿里巴巴集团控股有限公司,未经阿里巴巴集团控股有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201010120044.X/,转载请声明来源钻瓜专利网。