[发明专利]一种拼音的长句连打输入方法及其系统在审
申请号: | 201610029530.8 | 申请日: | 2016-01-16 |
公开(公告)号: | CN105718070A | 公开(公告)日: | 2016-06-29 |
发明(设计)人: | 周诚 | 申请(专利权)人: | 上海高欣计算机系统有限公司 |
主分类号: | G06F3/023 | 分类号: | G06F3/023 |
代理公司: | 上海晨皓知识产权代理事务所(普通合伙) 31260 | 代理人: | 成丽杰 |
地址: | 201203 上海市浦东新区自由*** | 国省代码: | 上海;31 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 拼音 长句 连打 输入 方法 及其 系统 | ||
1.一种拼音的长句连打输入方法,其特征在于,包含以下步骤:
预先建立双向隐马尔可夫BHMM模型;在所述BHMM模型中,长句 中的每个汉字的出现概率由正向传播时该汉字及该汉字的前N个汉字在数 据库中同时出现的次数,反向传播时该汉字及该汉字的后N个汉字在数据 库中同时出现的次数决定;所述N为大于1的自然数;
持续接收用户输入的拼音码;
根据所述BHMM模型和所述持续接收到的拼音码,获取在该BHMM 模型中出现概率最大的各汉字所组成的长句;
输出所述获取的在该BHMM模型中出现概率最大的各汉字所组成的长 句。
2.根据权利要求1所述的拼音的长句连打输入方法,其特征在于,
所述BHMM模型建立在云端服务器内;
所述根据BHMM模型和所述持续接收到的拼音码,获取在该BHMM 模型中出现概率最大的各汉字所组成的长句的步骤中,包含以下子步骤:
客户端将所述持续接收到的拼音码实时发送至所述云端服务器,由所述 云端服务器根据BHMM模型和所述持续接收到的拼音码,实时获取所述长 句。
3.根据权利要求1所述的拼音的长句连打输入方法,其特征在于,所 述根据BHMM模型和所述持续接收到的拼音码,获取在该BHMM模型中 出现概率最大的各汉字所组成的长句的步骤中,根据以下公式获取所述长 句:
其中,w1,w2,...,wL表示获取的所述长句中的各汉字,L为大于1的自然数; P(wi|wi-1,wi-2,...wi-N)代表在正向传播过程中,汉字wi的前N个汉字wi-1,wi-2,...wi-N出现的情况下,汉字wi出现的概率;P(w′i|w′i+1,w′i+2,...w′i+N)代表在反向传播过程 中,汉字w′i的后N个汉字w′i+1,w′i+2,...w′i+N出现的情况下,汉字w′i出现的概率。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于上海高欣计算机系统有限公司,未经上海高欣计算机系统有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201610029530.8/1.html,转载请声明来源钻瓜专利网。
- 上一篇:眼镜架
- 下一篇:一种建筑物结构改造信息化监测系统