[发明专利]一种差异显示方法、装置、设备及存储介质在审
申请号: | 202210292279.X | 申请日: | 2022-03-24 |
公开(公告)号: | CN114385849A | 公开(公告)日: | 2022-04-22 |
发明(设计)人: | 丛羽日 | 申请(专利权)人: | 北京惠朗时代科技有限公司 |
主分类号: | G06F16/583 | 分类号: | G06F16/583;G06F16/58;G06F16/54;G06V30/40 |
代理公司: | 北京品源专利代理有限公司 11332 | 代理人: | 杨义 |
地址: | 102600 北京市大兴区*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 差异 显示 方法 装置 设备 存储 介质 | ||
本发明实施例公开了一种差异显示方法、装置、设备及存储介质。该方法包括:获取源文本和所述源文本对应的目标图像;对所述目标图像进行识别,得到所述目标图像对应的扫描文本;根据所述源文本和所述扫描文本确定差异信息,并显示所述差异信息。上述技术方案,通过采用对目标图像识别得到扫描文本,并根据源文本和扫描文本确定并显示差异信息的方式,提高了文本比对精度以及提高了差异信息可视化的用户体验。
技术领域
本发明实施例涉及计算机软件应用技术领域,尤其涉及一种差异显示方法、装置、设备及存储介质。
背景技术
在日常工作中,为判断两个文档内容的不同,可以同时打开两个文档人工进行识别比对,但这种比对方式较为耗时且出错可能性较大。
在现有技术中,传统的文本比对软件,通过图形处理器(graphics processingunit,GPU)来处理文本比对服务,硬件基于高端的显卡,同时处理文本比对时需要大容量的显存,导致成本高,耗能高,占用空间大,本地部署灵活性小,不适用于中小型企事业单位,云端部署时普通服务器不能满足其配置要求。对用户而言,需要付出大量的经济成本,并且不能满足用户的个性化需求。
CN111914597A公开了一种文档对照识别方法、装置、电子设备和可读存储介质,获取待对照文档的图像和参考文档的电子文档,基于预先训练的区域识别模型,识别待对照文档的图像中的每一行字符区域,基于预先训练的字符识别模型,识别每一行字符区域中的字符内容,得到识别后的字符,获取识别后的字符的位置信息,根据位置信息以及识别后的字符,生成待对照文档的电子文档,对待对照文档的电子文档和参考文档的电子文档进行内容对比,根据差异点所在的位置信息,输出待对照文档的图像的对应内容与参考文档的电子文档或参考文档的图像的对应内容进行对照显示。但是上述现有技术在文本对比时,并未考虑漏行或错行问题,使得整篇文本都会有标注错误的问题。
发明内容
本发明实施例提供一种差异显示方法、装置、设备及存储介质,以提高文本比对精度和提高差异信息可视化的用户体验。
第一方面,本发明实施例提供了一种差异显示方法,包括:
获取源文本和所述源文本对应的目标图像;
对所述目标图像进行识别,得到所述目标图像对应的扫描文本;
根据所述源文本和所述扫描文本确定差异信息,并显示所述差异信息;
其中,对所述目标图像进行识别,得到所述目标图像对应的扫描文本,包括:
对所述目标图像进行识别,得到所述目标图像对应的第一文本和所述第一文本中每一行相对于所述目标图像的位置坐标;
根据所述源文本、第一文本和所述第一文本中每一行相对于所述目标图像的位置坐标对所述第一文本进行整理,得到扫描文本。
第二方面,本发明实施例还提供了一种差异显示装置,所述装置包括:
图像获取模块,用于获取源文本和所述源文本对应的目标图像;
图像识别模块,用于对所述目标图像进行识别,得到所述目标图像对应的扫描文本;
信息确定模块,用于根据所述源文本和所述扫描文本确定差异信息,并显示所述差异信息。
第三方面,本发明实施例还提供了一种电子设备,包括:
一个或多个处理器;
存储装置,用于存储一个或多个程序,
当所述一个或多个程序被所述一个或多个处理器执行,使得所述一个或多个处理器实现如本发明实施例中任一所述的差异显示方法。
第四方面,本发明实施例还提供了一种计算机可读存储介质,其上存储有计算机程序,该程序被处理器执行时实现如本发明实施例中任一所述的差异显示方法。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京惠朗时代科技有限公司,未经北京惠朗时代科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202210292279.X/2.html,转载请声明来源钻瓜专利网。