[发明专利]一种基于移动终端的中文词条索引压缩方法及移动终端有效
申请号: | 201511032929.3 | 申请日: | 2015-12-31 |
公开(公告)号: | CN105677809B | 公开(公告)日: | 2019-06-28 |
发明(设计)人: | 郭金林;覃炜 | 申请(专利权)人: | 广州华多网络科技有限公司 |
主分类号: | G06F16/31 | 分类号: | G06F16/31;G06F16/33;G06F16/35 |
代理公司: | 北京集佳知识产权代理有限公司 11227 | 代理人: | 杨炳财;屈慧丽 |
地址: | 511442 广东省广*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 移动 终端 中文 词条 索引 压缩 方法 | ||
本发明实施例公开了一种基于移动终端的中文词条索引压缩方法及移动终端,实现了移动终端的ROM或SD中存储的数据量大大地减少,从而使得后续索引检索的处理速度提高,解决了传统的数据库索引方案,由于没有针对中文词条进行优化,造成的在面对检索包含部分字或词的词条的信息时效率低下的技术问题。本发明实施例基于移动终端的中文词条索引压缩方法包括:对分类后的所有词组按照关键字进行关联,并建立相对应的关联词组列表;将关联词组列表进行基于关键字在词组中的位置关系的编码处理,并成为相对应的压缩字符串;将压缩字符串进行存储。
技术领域
本发明涉及数据挖掘技术领域,尤其涉及一种基于移动终端的中文词条索引压缩方法及移动终端。
背景技术
索引是对数据库表中一个或多个列(例如,employee表的姓名(name)列)的值进行排序的结构。如果想按特定职员的姓来查找他或她,则与在表中搜索所有的行相比,索引有助于更快地获取信息。数据库索引好比是一本书前面的目录,能加快数据库的查询速度。索引分为聚簇索引和非聚簇索引两种,聚簇索引是按照数据存放的物理位置为顺序的,而非聚簇索引就不一样了;聚簇索引能提高多行检索的速度,而非聚簇索引对于单行的检索很快。根据数据库的功能,可以在数据库设计器中创建三种索引:唯一索引、主键索引和聚集索引。
在Android、IOS等手机平板移动端,做离线数据查询时,若要高效率的快速检索出结果,就需要存储大量源数据到ROM或SD中,而手机ROM和SD的空间,和运算能力有限,存储不了大量数据,检索性能也地下,由于传统的数据库索引方案,没有针对中文词条进行优化,因此,造成了在面对检索包含部分字或词的词条的信息时效率低下的技术问题。
发明内容
本发明实施例提供的一种基于移动终端的中文词条索引压缩方法及移动终端,实现了移动终端的ROM或SD中存储的数据量大大地减少,从而使得后续索引检索的处理速度提高,解决了传统的数据库索引方案,由于没有针对中文词条进行优化,造成的在面对检索包含部分字或词的词条的信息时效率低下的技术问题。
本发明实施例提供的一种基于移动终端的中文词条索引压缩方法,包括:
对分类后的所有词组按照关键字进行关联,并建立相对应的关联词组列表;
将所述关联词组列表进行基于所述关键字在所述词组中的位置关系的编码处理,并成为相对应的压缩字符串;
将所述压缩字符串进行存储。
优选地,对分类后的所有词组按照关键字进行关联,并建立相对应的关联词组列表之前还包括:
对所有所述词组进行扫描,并将相互之间相关联的所述词组进行分类处理。
优选地,将所述关联词组列表进行基于所述关键字在所述词组中的位置关系的编码处理,并成为相对应的压缩字符串之前还包括:
对所述关联词组列表的所述关键字以特殊字符进行在对应的所述词组中的所述位置关系的设定。
优选地,将所述关联词组列表进行基于所述关键字在所述词组中的位置关系的编码处理,并成为相对应的压缩字符串具体包括:
根据所述的特殊字符对所述关联词组列表进行基于所述关键字的编码处理,并成为相对应的压缩字符串。
优选地,所述特殊字符在对应的所述词组中的所述位置关系为词组中间位置关系、词组前面位置关系、词组末尾位置关系。
优选地,所述特殊字符还包括在对应的所述词组中用前位词组替换当前字符的表示。
优选地,所述特殊字符还包括对应词组的词性类型的表示。
优选地,将所述压缩字符串进行存储之后还包括:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于广州华多网络科技有限公司,未经广州华多网络科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201511032929.3/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种排行榜刷新方法及装置
- 下一篇:一种即时通信建立方法及装置