[发明专利]一种数字化汉字拼字实现方法和装置有效
申请号: | 201611129421.X | 申请日: | 2016-12-09 |
公开(公告)号: | CN106776499B9 | 公开(公告)日: | 2021-02-12 |
发明(设计)人: | 薛永增;刘超然;赵东 | 申请(专利权)人: | 哈尔滨工业大学 |
主分类号: | G06F40/126 | 分类号: | G06F40/126;A63F9/06 |
代理公司: | 哈尔滨市阳光惠远知识产权代理有限公司 23211 | 代理人: | 蔡岩岩 |
地址: | 150006 黑龙*** | 国省代码: | 黑龙江;23 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 数字化 汉字 拼字 实现 方法 装置 | ||
本发明提出一种数字化汉字拼字实现方法和装置,属于数字化汉字拼字技术领域。该方法用精确到笔画的汉字组成部分的相对空间位置来表示汉字,并在显示设备上显示和拖拽汉字的组成部件;当汉字的组成部件在相对空间位置上能够拼合成一个字的时候,识别拼合出来的汉字;显示该汉字的相关信息,如读音、字义、组词、例句等。该方法能够对汉字产生精确的识别。
技术领域
本发明涉及一种数字化汉字拼字实现方法和装置,属于数字化汉字拼字技术领域。
背景技术
现有的汉字构型的表示方法,多是以汉字的笔画输入为目标,在这类表示方法中,没有汉字各个组成部分空间结构的完整信息,不能实现对汉字任意拆分方式的还原。例如,很多这类构型方法中,仅能表示出“思”这样的合体字为上“田”下“心”结构,不能进一步表示“田”这样的单体字。或者虽然能表示“田”这样的单体字是3横3竖结构,却不能表示横竖之间的空间位置关系,因此无法区分“田”、“由”、“甲”这类同样由3横3竖构成的字。
另一类汉字构型的表示方法,则主要针对构建汉字的字体库,这类表示中汉字各个组成部分的空间位置是固定的,因此如果显示的汉字在相对位置上构成汉字,但是各个笔画的具体位置不同,用这种表示方法就无法区分了。如图1所示,这两个“思”字在人来看是一个字,但是右边的字明显和左边根据字库中生成的字有差别。
在识字教育中,往往需要让使用者自己通过笔画或部首拼合出汉字,然后再对汉字的具体读音、字义、用法等进行详细的解释。目前基于数字化设备的拼字游戏往往是通过对所能处理的汉字的个数加以限制,或者对于使用者拼合过程中汉字组成部分的空间位置加以限定来实现拼字游戏的。这样就不能对任意汉字通过任意组成部分进行拼字。例如:有些拼字游戏仅能实现用3个“口”拼合成“品”,不能进一步用6横6竖拼合成“品”,或者需要先将6横6竖拼合成3个“口”,再进一步拼合成“品”。有些拼字游戏需要把6横6竖精确地放到某一个限定区域才能识别出拼出来的字是“品”。
另一种可能的实现方法是对于拼合以后的字通过模式识别的方法进行汉字识别,这种方法尽管识别率高,但是也难免会存在识别错误,甚至无法识别的情况。
总之,在目前的基于数字化设备的拼字游戏中,对于任何汉字,通过任何组成部分进行拼字,仅通过拼合后汉字各个组成部分的空间的相对位置来判断是不是一个字是难以做到的。
发明内容
为解决上述现有技术中存在的技术问题,本发明提出了一种数字化汉字拼字实现方法和装置。
一种数字化汉字拼字实现装置,其特征在于,所述装置包括:
用汉字的最小组成部件的相对位置空间表示汉字的表示模块;
识别所述最小组成部件在相对空间位置上拼合成字的识别模块;
显示所述汉字相关信息的显示模块。
进一步地,所述装置还包括:
对组成汉字的基本笔画、难以用基本笔画来构建的偏旁部首和单体字建立索引表的索引建立模块;
将汉字拆分为代表基本笔画、难以用基本笔画来构建的偏旁部首和单体字的最小组成部件的汉字拆分模块;
确定所述最小组成部件的最小矩形的矩形确定模块;
确定所述最小矩形四个边沿的相对空间位置关系的空间位置关系确定模块。
进一步地,所述装置还包括:
将汉字的所有最小部件进行编码的字内编码模块;
根据索引表和字内编码建立最小部件表的最小部件表建立模块;
根据汉字所有最小矩形的相对空间位置关系建立位置关系表的位置关系表建立模块;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于哈尔滨工业大学,未经哈尔滨工业大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201611129421.X/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种数据导出为PDF的方法
- 下一篇:一种字库纹理数据管理方法