[发明专利]一种文字相似度自动检索判断方法在审
申请号: | 202310137259.X | 申请日: | 2023-02-20 |
公开(公告)号: | CN116110061A | 公开(公告)日: | 2023-05-12 |
发明(设计)人: | 余就裕;崔龙强;黎远伟 | 申请(专利权)人: | 深圳高新邦技术有限公司 |
主分类号: | G06V30/226 | 分类号: | G06V30/226;G06V30/19 |
代理公司: | 深圳众邦专利代理有限公司 44545 | 代理人: | 张啸 |
地址: | 518000 广东省深圳市龙华区龙*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 文字 相似 自动 检索 判断 方法 | ||
本发明属于文字识别技术领域,尤其是一种文字相似度自动检索判断方法,针对目前的文字识别效果差,不能对形体相似的文字进行遗漏检索,使用效果差的问题,现提出如下方案,其以下步骤:S1:建立候选文字识别模板,按照文字的结构、笔画进行分类建模;S2:录入需要识别的文字数据;将需要识别的文字数据进行录入,录入方式包括:拍照录入、语音录入、人工键盘输入;S3:提取文字数据按照结构、笔画进行分类;S4:将分类后的文字与模板进行对比;首先,将获取的文字数据安装结构分类归纳到结构类模板,然后,安装笔画进行分类,归纳到笔画类模板,将文字数据与模板进行比对,采用三点定位,然后进行逐个比对。
技术领域
本发明涉及文字识别技术领域,尤其涉及一种文字相似度自动检索判断方法。
背景技术
专利检索就是科研立项和申请专利之前需要检索专利,以免重复研制,侵犯他人专利权,事先检索也可判断该项技术成果是否有可能获得专利权。可以去国家知识产权局专利文献馆手工检索专利,也可以用电脑上网检索,简单地说专利信息检索就是有关专利信息的查找。检索结果是否全面直接影响到整个新项目的成败,检索不全面、漏检,可能造成投入了大量人力物力后与其他企业的现有的技术雷同,不具有新颖性而白白浪费,因而检索是新项目立项的重要环节。对于单纯以文字类型注册的商标来说,由于汉字形体结构的特点,使得汉字存在众多的形近字,这就导致文字注册商标中经常出现相近商标,在出现相近商标的情况下,就需要对相近商标进行近似审核,在进行近似审核过程中就需要用到文字相似度检索分析方法。
目前的文字近似度检索分析方法大部分都是以待近似检索文字本身的偏旁部件作为近似度检索分析依据进行近似度检索分析,这种近似度检索分析方式由于检索分析依据单一,一方面只能检索到与待近似检索文字具有相同偏旁部件的文字,对于一些与待近似检索文字具有的偏旁部件不同但整体形状相似的文字通常会遗漏检索,导致检索范围有限。
发明内容
本发明的目的是为了解决目前的文字识别效果差,不能对形体相似的文字进行遗漏检索,使用效果差的缺点,而提出的一种文字相似度自动检索判断方法。
为了实现上述目的,本发明采用了如下技术方案:
一种文字相似度自动检索判断方法,包括以下步骤:
S1:建立候选文字识别模板,按照文字的结构、笔画进行分类建模;
S2:录入需要识别的文字数据;,将需要识别的文字数据进行录入,录入方式包括:拍照录入、语音录入、人工键盘输入;
S3:提取文字数据按照结构、笔画进行分类;
S4:将分类后的文字与模板进行对比;首先,将获取的文字数据安装结构分类归纳到结构类模板,然后,安装笔画进行分类,归纳到笔画类模板,最后,将文字数据与模板进行比对,采用三点定位,然后进行逐个比对;
S5:设置对比相似度比例值为50-70%;
S6:进行二次对比,并将对比值设置为71-99%;
S7:对文字综合近似度进行分析;
S8:将识别后文字进行排序显示。
优选的,所述S1中,建立候选文字模板并按照结构、笔画进行分类建模,建模的文字设置三点坐标,三点坐标依次为上方、左下和右下。
优选的,所述S1中,将建立的文字制作为图片形式进行保存,将建立的文字图片安装1、2、3……n进行标号。
优选的,所述S2中,拍照录入采用图片文字提取的方式获取文字数据;
语音录入采用语音提取的方式获取文字数据;
人工键盘输入通过人工对文字数据进行录入。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于深圳高新邦技术有限公司,未经深圳高新邦技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202310137259.X/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种导电胶及其制备方法、应用
- 下一篇:一种导弹高速侧面击水柔性降载装置