[发明专利]汉字字首排检及信息处理方法有效
申请号: | 201510179371.5 | 申请日: | 2015-04-16 |
公开(公告)号: | CN104765837B | 公开(公告)日: | 2019-09-13 |
发明(设计)人: | 刘立德;刘汝佳;刘蔚 | 申请(专利权)人: | 刘立德 |
主分类号: | G06F16/903 | 分类号: | G06F16/903 |
代理公司: | 北京轻创知识产权代理有限公司 11212 | 代理人: | 杨立 |
地址: | 404100 重庆*** | 国省代码: | 重庆;50 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明实施例公开了一种汉字字首排检及信息处理方法,其中,所述方法包括:预先建立笔段特征库,确定待处理的汉字集合,对各个汉字的组成结构进行图形检测,确定所述汉字所具有的笔段,并将各个笔段的图形检测结果与所述特征库中的图形特征进行比对,将所述获取到的字首相同的汉字进行分组,根据分组以及排序结果生成汉字信息数据库。通过本申请提供的方法能够将所有汉字按照统一的标准进行归纳总结,解决了传统汉字排序方法存在的笔形位置不固定、重码多以及添加附加码后重码验证等问题,使汉字的排检更加简洁方便,显著提高检索速度。为了提高处理的效率以及准确度,本发明通过计算机辅助的方式实现自动化的汉字信息处理。 | ||
搜索关键词: | 汉字 字首 排检 信息处理 方法 | ||
【主权项】:
1.一种汉字字首排检及信息处理方法,其特征在于,包括:预先建立笔段特征库,所述特征库中保存有各个笔段的名称以及对应的图形特征信息,所述笔段根据汉字笔画单元的形状确定;所述笔段特征库中,各个笔段的名称以及对应的图形特征信息包括:横,形状特征是自左而右,或稍斜向右上方,两端粗细相同,可自成笔画,也可作为折笔的首段、中段或末段;提,形状特征是自左下而右上、由粗而细提为尖,可自成笔画,也可作为折笔的首段或末段;竖,形状特征是自上而下,或稍斜向左下方,两端粗细一样,可自成笔画,也可作为折笔的首段、中段或末段;撇,形状特征是自上而下再向左偏收尖,或自上而左下斜收尖、或平斜收尖,可自成笔画,也可作为折笔的首段、中段或末段;点,形状特征是自尖而顿圆,或向右下,或向左下,可自成笔画,也可为折笔的首段或末段;捺,形状特征是自左上起尖渐粗,然后平拖或向右下斜拖,独自成画时收为尖,可自成笔画,也可作为折笔的前段、中段或末段;左弯,形状特征是自上尖细而左弯垂粗、或自右上粗左斜弯,只能作首段,与钩合成折笔;钩,形状特征是一个尖,或朝左,或朝上,只能作折笔的末段;圈,形状特征为圆形,本身是个笔画,不能构成别的笔画;确定待处理的汉字集合,所述汉字集合中的各个汉字具有相同的字体以及字号;对各个汉字的组成结构进行图形检测,确定所述汉字所具有的笔段,并将各个笔段的图形检测结果与所述特征库中的图形特征进行比对,确定汉字笔画位次,生成笔画位次表,所述笔画位次表根据笔段排列;确定汉字的笔序,所述笔序为单字笔画的先后次序;确定各个汉字的字首以及字身,所述字首为所述汉字根据所述笔序开头笔画的结合体,所述字身为除去字首笔画以外的部分;将获取到的字首相同的汉字进行分组,并获取所述字首起始笔画,按照所述字首起始笔画在所述笔画位次表中的排列顺序,将组别中的各个汉字进行排序;其中,当所述获取到的字首起始笔画相同时,获取所述字身起始笔画,根据所述字身起始笔画在所述笔画位次表中的排列顺序,将所述字首相同的汉字进行排序;根据分组以及排序结果生成汉字信息数据库。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于刘立德,未经刘立德许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201510179371.5/,转载请声明来源钻瓜专利网。