[发明专利]一种基于篇章文档的自适应输入法有效
申请号: | 201410229623.6 | 申请日: | 2014-05-27 |
公开(公告)号: | CN103970910B | 公开(公告)日: | 2017-02-15 |
发明(设计)人: | 戴新宇;杨理想;陈家骏;黄书剑;李斌 | 申请(专利权)人: | 南京大学 |
主分类号: | G06F17/30 | 分类号: | G06F17/30 |
代理公司: | 江苏圣典律师事务所32237 | 代理人: | 胡建华 |
地址: | 210023 江苏省南*** | 国省代码: | 江苏;32 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明提出了一种基于用户本地篇章文档的自适应输入法,与传统的输入法不同,本发明基于用户本地文档,自动感知用户当前的知识领域。首先,系统自动建立一个基础数据集,不同的知识领域建立相应的领域数据集,系统会根据用户已输入文字信息感知到相应的领域并自动切换到当前的领域数据集,通过调整领域数据集和基础数据集之间的权值关系,提高领域数据集的比重,实现不同知识领域之间的自动感知和参数调整;随着输入信息的增加,相应的领域数据集也会不断的更新,同时提取领域数据集中的高频字串动态填充基础数据集信息。本输入法更加智能的理解用户要输入的信息,减少选择次数,提高首次选择的准确率,同时也显著降低了重码率。 | ||
搜索关键词: | 一种 基于 篇章 文档 自适应 输入法 | ||
【主权项】:
一种基于篇章文档的自适应输入法,其特征在于,包括以下步骤:步骤一,建立基础数据集Base;步骤二,建立领域数据集Dset:步骤三,根据用户已经输入信息以及领域数据集和基础数据集之间的权重关系调整得到当前输入字的概率;步骤四,音字转换输出:切分用户输入的拼音串、结合步骤三当前输入字的概率,利用隐马尔科夫模型HMM,计算得出字串的概率,并按照字串概率值的大小排序输出;步骤五,领域数据集实时更新:输入法根据用户的输入得出可能的字串,再根据用户选定的字串添加到相应的领域数据集中实时更新信息;步骤六,基础数据集更新:提取领域数据集中出现频率大于设定阈值的字串添加到基础数据集中,不断更新基础数据集。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于南京大学,未经南京大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201410229623.6/,转载请声明来源钻瓜专利网。
- 上一篇:预制通孔装配式钢筋混凝土剪力墙
- 下一篇:一种光传输装置及移动电子装置