[发明专利]一种字形识别方法、电子设备及存储介质在审
申请号: | 201811563191.7 | 申请日: | 2018-12-20 |
公开(公告)号: | CN109857912A | 公开(公告)日: | 2019-06-07 |
发明(设计)人: | 王新林 | 申请(专利权)人: | 广州企图腾科技有限公司 |
主分类号: | G06F16/903 | 分类号: | G06F16/903 |
代理公司: | 广州市越秀区哲力专利商标事务所(普通合伙) 44288 | 代理人: | 谢嘉舜;孙中华 |
地址: | 511457 广东省广州市*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明公开了一种字形识别方法,包括:文字识别步骤,获取待检索文本,根据四角码编码原则将文本文字依序生成对应四角码,并对应查找字库获知待检索文本每个字的笔画数信息;比对步骤,将依序排列的四角码数据串与比对数据库进行分析比对,生成字形相似度列表,根据字形相似度列表结合待检索文本各个字的笔画数信息比对结果,判断是否存在字形相似情况。本申请还公开了一种电子设备及存储介质,本申请通过对待检索的文本文字获取各文字的四角码,再结合对应各个文字的笔画数信息,与比对数据库进行比对,通过综合两种比对结果判断字形相似度情况。并且摒弃了图像识别比对的方法,排除了图像识别误差,使得字形相似度判断更为准确。 | ||
搜索关键词: | 字形相似度 四角码 检索文本 笔画数 比对数据库 存储介质 电子设备 图像识别 文本文字 字形识别 比对 比对步骤 比对结果 编码原则 分析比对 文字识别 信息比对 依序排列 字库 数据串 获知 申请 检索 查找 | ||
【主权项】:
1.一种字形识别方法,其特征在于,包括:文字识别步骤,获取待检索文本,根据四角码编码原则生成对应四角码数据串,并根据字库对应查找获知待检索文本的文字属性信息;比对步骤,将四角码数据串与比对数据库各文本文字的四角码数据串信息进行分析比对,取四角码相似度比对结果达到设定四角码相似度阈值的文本,生成比对文本集,根据比对数据库匹配比对文本集各文本的文字属性信息,得出比对文本集各文本的文字属性信息与待检索文本的文字属性信息的相似度比对结果,综合四角码相似度比对结果,判断字形相似情况。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于广州企图腾科技有限公司,未经广州企图腾科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201811563191.7/,转载请声明来源钻瓜专利网。