[发明专利]一种文本图像相似度评估方法、装置及计算设备有效
申请号: | 202110470388.1 | 申请日: | 2021-04-29 |
公开(公告)号: | CN112990376B | 公开(公告)日: | 2021-11-02 |
发明(设计)人: | 秦勇 | 申请(专利权)人: | 北京世纪好未来教育科技有限公司 |
主分类号: | G06K9/62 | 分类号: | G06K9/62;G06K9/46 |
代理公司: | 北京鼎承知识产权代理有限公司 11551 | 代理人: | 顾可嘉;夏华栋 |
地址: | 100872 北京市海淀区中*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 文本 图像 相似 评估 方法 装置 计算 设备 | ||
本发明提供了一种文本图像相似度评估方法、装置、可读存储介质及计算设备,通过利用图像特征点的重排序结果进行文本图像的相似度计算,实现了效果更好、速度更快且成本更低的文本图像相似度评估。方法包括:获取两张文本图像;分别从所述两张文本图像中选取相同数量的特征点;根据所述两张文本图像的特征点的匹配结果,确定所述两张文本图像的特征点的坐标映射关系;对所述两张文本图像的特征点按照所述坐标映射关系排序,使得所述两张文本图像的同一序号的特征点的坐标符合所述坐标映射关系;根据所述两张文本图像的按照所述坐标映射关系排序后的特征点的像素值,计算所述两张文本图像的第一相似度。
技术领域
本发明涉及文本图像处理领域,尤其涉及一种文本图像相似度评估方法、装置、可读存储介质及计算设备。
背景技术
图像相似度评估是一个比较古老的研究课题,从早期的经验公式计算评估,到模式识别的方法,使用人工经验设计的算子,再到现在使用各种深度学习的方法,在这个过程中,涌现出了大量的经典模型和方法,早期使用经验公式评估两张图像相似度的方法有PSNR(峰值信噪比)和SSIM(结构相似性),即直接从像素值上通过计算判断两张图像的相似性,模式识别的方法使用人工经验设计的算子,如SIFT(尺度不变特征变换)、SURF(加速提取鲁棒性特征)分别提取两张图像的特征点,组成特征向量,然后采用某种度量方式,如余弦距离、欧式距离和汉明距离等,计算两个特征向量向量之间的距离,然后根据预先设置的阈值,判断两种图像的相似度。深度学习的方法是目前使用最为广泛,也是效果最好的方法,其代表有Siamese(孪生网络)和Pseudo-siamese(伪孪生网络)通过使用两个神经网络模型分支,分别提取两张图像的特征,最后将提取到的特征进行合并,得到相似度分析结果,与其它深度学习方法相同,通过反向传播算法来优化目标函数,当目标函数的值被优化达到一个比较好的结果时,网络对图像进行相似度评估能够取得非常好的结果。
文本图像相似度评估是图像相似度评估的特定问题,所谓文本图像就是指由字符或者数字组成的图像,与一般的自然场景图像进行区分,相比于自然场景图像,文本图像的纹理结构比较单一,而且由于其排版等原因,很可能两张内容完全不一样的文本图像,如果不考虑其内容信息,它可能看上去一模一样,所以其相似度评估是比较困难的,但是其在很多问题中都有非常重要的价值。虽然使用神经网络模型进行文本图像相似度评估能取得很好的效果,但是问题在于其训练数据难以收集,标注成本非常高,而且有时数据的质量也很难保证。
目前拍照批改数学题和拍照搜题等人工智能应用层出不穷,大量的题目无法基于逻辑进行批改,只能依赖于建立题库,而题库提供的整页答案需要与用户拍照上传页进行相似度判定,这对后续判题非常重要。
综上所述,图像相似度评估有广泛的应用前景,使用深度学习方法能够获得很好的效果,但是其训练数据需要大量的人工进行标注。文本图像的相似度评估在拍照判题等应用中有重要作用,其纹理特征相较于自然场景图像更为单一,而且由于其全部都是文字信息,且有各种排版方式,所以其相似度判断更为困难。
发明内容
为此,本发明提供了一种文本图像相似度评估方法、装置、可读存储介质及计算设备,以力图解决或者至少缓解上面存在的至少一个问题。
根据本发明实施例的一个方面,提供了一种文本图像相似度评估方法,包括:
获取两张文本图像;
分别从所述两张文本图像中选取相同数量的特征点;
根据所述两张文本图像的特征点的匹配结果,确定所述两张文本图像的特征点的坐标映射关系;
对所述两张文本图像的特征点排序,使得所述两张文本图像的同一序号的特征点的坐标符合所述坐标映射关系;
根据所述两张文本图像的按照所述坐标映射关系排序后的特征点的像素值,计算所述两张文本图像的第一相似度。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京世纪好未来教育科技有限公司,未经北京世纪好未来教育科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110470388.1/2.html,转载请声明来源钻瓜专利网。
- 彩色图像和单色图像的图像处理
- 图像编码/图像解码方法以及图像编码/图像解码装置
- 图像处理装置、图像形成装置、图像读取装置、图像处理方法
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序以及图像解码程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序、以及图像解码程序
- 图像形成设备、图像形成系统和图像形成方法
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序