[发明专利]基于图像检索的古文字考释方法和装置在审
申请号: | 202010010966.9 | 申请日: | 2020-01-06 |
公开(公告)号: | CN111241329A | 公开(公告)日: | 2020-06-05 |
发明(设计)人: | 张闯;徐志鹏;吴铭;胡燕;徐梦秋;赵雨生 | 申请(专利权)人: | 北京邮电大学;北京世屹文化传媒集团有限公司 |
主分类号: | G06F16/583 | 分类号: | G06F16/583;G06F16/58;G06K9/46;G06K9/62;G06N3/04;G06N3/08 |
代理公司: | 北京挺立专利事务所(普通合伙) 11265 | 代理人: | 高福勇 |
地址: | 100876 *** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 图像 检索 古文字 考释 方法 装置 | ||
本公开提供了一种基于图像检索的古文字考释方法,获取古文字图像;对图像中的古文字特征进行提取;将提取的古文字特征与本地端预存的古文字特征数据库进行匹配;查询出满足预设匹配阈值的古文字以及所对应的简体字完成考释操作。该方法将应用基于深度学习的图像检索方法,主要是将深度学习方法应用在简牍古文字图像检索中的特征提取中,利用卷积神经网络提取简牍古文字图片特征,利用度量学习方法如欧式距离对简牍古文字特征进行计算距离,根据距离对简牍古文字之间的特征相似性进行排序,得到最终的检索结果。具有检索的快捷性以及考释的精准性与易用性。本公开还提供了一种基于图像检索的古文字考释装置。
技术领域
本公开涉及图像检索技术领域,具体而言,涉及一种基于图像检索的古文字考释方法和装置。
背景技术
汉字是中华文明的标志,是与中华文明相辅相成的。古文字作为汉字发展的渊源,记录了中华文明的起源与发展。所以,研究好古文字对于研究中华文明有极其重要的影响,对于中国古代的经济、政治、文化等方面的发展有更加清晰的了解。而简牍古文字作为秦及先秦文字的重要表现形式,对其进行深入、细致、有效的研究就有着重大的意义。
简牍是对我国古代遗存下来的写有文字的竹简与木牍的概称。用竹片写的书称简策,用木版(也作板)写的叫版牍。超过100字的长文,就写在简策上,不到100字的短文,便写在木版上。简由竹或木加工而成,通常是削成长条形,将写字的一面磨光。简的宽度一般为0.5-1厘米,厚数毫米,长度根据需要而定,在汉代有3尺、2.4尺、1.2尺、0.8尺(以上均汉尺)等。每枚简上书写一行字。也有少数简加宽约一倍,书写两行,径称为两行。很多枚简用麻绳或丝绳编连起来,叫做册。一般编2-5道,也有个别编1道的,通常视简的长度而定,大多数是先编后写。牍多为木质,与简不同之处是加宽好几倍,有的宽到6厘米左右,个别的达15厘米以上,呈长方形,故又叫做方或版。牍多用来书写契约、医方、历谱、过所(通行证)、书信等。书信多用1尺(汉尺)的牍,所以人们常将书信称为尺牍。
古文字指的是古代的文字。在中国则特指秦以前留传下来的篆文体系的文字,如甲骨文和金文还有蝌蚪文。古文字在历史中经历了长时间的演变,是中华民族智慧的结晶。而简牍古文字主要分为两个时期:先秦简牍,多用古文、篆文;秦始皇统一中国后,通行隶书,字体变圆为方,于是公文、信函多用隶书。
由于简牍古文字具有定性化、非结构化、隐蔽性和语义不确定性等特点,简牍古文字考释的过程中仍存在很多难点,虽然这些难点可以被人工考释的过程逐一解决,但却会花费大量的时间,使研究人员的考释效率降低。首先,研究人员在研究一个新的简牍文字时往往要翻阅很多简牍文字,从而理解当前文字。但是在翻阅的过程中,研究人员将花费大量的时间查找相关资料,并进行分析和决断,这将大大降低研究者的工作效率。同时,在逐个对文字进行考释的过程当中,由于工作量太大,出现考释结果的错误是不可避免的。
发明内容
为了解决现有技术中的技术问题,本公开实施例提供了一种基于图像检索的古文字考释方法和装置,该方法将应用基于深度学习的图像检索方法,主要是将深度学习方法应用在简牍古文字图像检索中的特征提取模块,利用卷积神经网络提取简牍古文字图片特征。主要步骤即给定一张简牍古文字图片,通过卷积神经网络对简牍古文字图片进行特征提取得到表征简牍古文字图片的特征,利用度量学习方法如欧式距离对简牍古文字特征进行计算距离,根据距离对简牍古文字之间的相似性进行排序,得到最终的检索结果。具有检索的快捷性以及考释的精准性与易用性。
第一方面,本公开实施例提供了一种基于图像检索的古文字考释方法,包括以下步骤:获取古文字图像;对图像中的古文字特征进行提取;将提取的所述古文字特征与本地端预存的古文字特征数据库进行匹配;查询出满足预设匹配阈值的古文字以及所对应的简体字完成考释操作。
在其中一个实施例中,所述获取古文字图像包括:通过结构化分析摄像机正面拍摄的方式获取古文字图像。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京邮电大学;北京世屹文化传媒集团有限公司,未经北京邮电大学;北京世屹文化传媒集团有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010010966.9/2.html,转载请声明来源钻瓜专利网。
- 彩色图像和单色图像的图像处理
- 图像编码/图像解码方法以及图像编码/图像解码装置
- 图像处理装置、图像形成装置、图像读取装置、图像处理方法
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序以及图像解码程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序、以及图像解码程序
- 图像形成设备、图像形成系统和图像形成方法
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序