[发明专利]基于时间序列的汉字输入法预测方法在审
申请号: | 202110107710.4 | 申请日: | 2021-01-27 |
公开(公告)号: | CN113190124A | 公开(公告)日: | 2021-07-30 |
发明(设计)人: | 左洪年 | 申请(专利权)人: | 中科曙光(南京)计算技术有限公司 |
主分类号: | G06F3/023 | 分类号: | G06F3/023 |
代理公司: | 南京苏高专利商标事务所(普通合伙) 32204 | 代理人: | 柏尚春 |
地址: | 211805 江苏省*** | 国省代码: | 江苏;32 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 时间 序列 汉字输入法 预测 方法 | ||
1.一种基于时间序列的汉字输入法预测方法,其特征在于,包括以下步骤:
步骤100:选取用户历史输入作为训练集,训练用户的时间序列模型;
步骤200:利用时间序列模型预测各汉字在键入时间出现的次数生成预测结果;
步骤300:根据用户已经键入的汉字或拼音,结合语义从预测结果中选择出现次数较高的汉字作为推荐汉字显示。
2.根据权利要求1所述的基于时间序列的汉字输入法预测方法,其特征在于,所述步骤300后还包括步骤400:采用损失函数衡量预测结果的精确程度。
3.根据权利要求2所述的基于时间序列的汉字输入法预测方法,其特征在于,所述步骤400中的损失函数为二次损失函数。
4.根据权利要求1所述的基于时间序列的汉字输入法预测方法,其特征在于,所述步骤100包括:
步骤110:选取用户历史输入作为训练集,建立用户汉字时间序列;
步骤120:验证用户汉字时间序列的平稳性,若用户汉字时间序列平稳则进入步骤130;
步骤130:判断用户汉字时间序列是否为白噪声序列,若用户汉字时间序列为非白噪声序列,则计算训练集的自相关系数和偏相关系数并获得训练集的自相关图和偏自相关图;
步骤140:根据自相关图和偏自相关图识别用户汉字时间序列类型,并根据序列类型建立模型方程;
步骤150:利用观测数据估计模型方程的参数;
步骤160:对模型方程进行定阶,获得时间序列模型。
5.根据权利要求4所述的基于时间序列的汉字输入法预测方法,其特征在于,所述步骤120还包括:
步骤121:若用户汉字时间序列不平稳,则对用户汉字时间序列进行差分处理并返回步骤120。
6.根据权利要求4或5所述的基于时间序列的汉字输入法预测方法,其特征在于,所述步骤120中采用单位根验证法验证用户汉字时间序列的平稳性。
7.根据权利要求4所述的基于时间序列的汉字输入法预测方法,其特征在于,所述步骤130中采用Q统计量方法检验用户汉字时间序列是否为白噪声序列。
8.根据权利要求4所述的基于时间序列的汉字输入法预测方法,其特征在于,所述步骤150中采用最大似然法估计模型方程的参数。
9.根据权利要求4所述的基于时间序列的汉字输入法预测方法,其特征在于,所述步骤160中采用赤池信息准则对模型方程进行定阶。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中科曙光(南京)计算技术有限公司,未经中科曙光(南京)计算技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110107710.4/1.html,转载请声明来源钻瓜专利网。