[发明专利]文档拼接方法、设备及存储介质在审
申请号: | 202010860455.6 | 申请日: | 2020-08-21 |
公开(公告)号: | CN112001312A | 公开(公告)日: | 2020-11-27 |
发明(设计)人: | 黄任 | 申请(专利权)人: | 深圳传音控股股份有限公司 |
主分类号: | G06K9/00 | 分类号: | G06K9/00;G06F40/109;G06F40/117 |
代理公司: | 深圳市世纪恒程知识产权代理事务所 44287 | 代理人: | 谢阅 |
地址: | 518057 广东省深圳市南山区粤海街道深南大道97*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 文档 拼接 方法 设备 存储 介质 | ||
1.一种文档拼接方法,其特征在于,所述文档拼接方法包括以下步骤:
获取包含文字的目标图片;
对所述目标图片进行文字识别,得到识别文档;
对所述识别文档进行拼接,得到目标文档。
2.如权利要求1所述的文档拼接方法,其特征在于,所述对所述目标图片进行文字识别,得到识别文档的步骤之后,包括:
获取所述识别文档的页眉或页脚,并根据所述识别文档的页脚或页眉,对所述识别文档排序,和/或,
获取所述识别文档对应的生成时间,并根据所述识别文档对应的生成时间,对所述识别文档排序,和/或,
获取所述识别文档的起始字符和结尾字符,并根据所述识别文档的起始字符和结尾字符,对所述识别文档排序,和/或,
获取所述识别文档中的数字字符,并根据所述数字字符,对所述识别文档排序。
3.如权利要求2所述的文档拼接方法,其特征在于,所述对所述识别文档排序的步骤之后,包括:
根据所述识别文档的排序结果,判断是否存在缺失文档;
若存在所述缺失文档,则对所述缺失文档对应的识别文档进行标记。
4.如权利要求1所述的文档拼接方法,其特征在于,所述对所述目标图片进行文字识别,得到识别文档的步骤之后,包括:
获取所述识别文档中的附图编号和数字字符;
若所述附图编号中的目标附图编号与所述数字字符中的目标数字字符相匹配,则将所述目标数字字符对应的文字字符输出到所述目标附图编号对应的目标附图中。
5.如权利要求4所述的文档拼接方法,其特征在于,所述对所述目标图片进行文字识别,得到识别文档的步骤包括:
获取所述附图编号的字体颜色,将所述附图编号对应的附图边框的颜色设置为所述字体颜色。
6.如权利要求4所述的文档拼接方法,其特征在于,所述获取所述识别文档中的附图编号和数字字符的步骤之后,包括:
若所述附图编号中的目标附图编号与所述数字字符中的目标数字字符相匹配,且当检测到用户基于所述目标数字字符所做出的点击操作时,将当前显示页面跳转至所述目标附图编号对应的目标附图;
对所述目标附图进行标记。
7.如权利要求6所述的文档拼接方法,其特征在于,所述对所述目标图片进行文字识别,得到识别文档的步骤之后,包括:
当接收到多页显示指令,确定所述目标数字字符对应的目标显示页面;
当检测到用户基于所述目标数字字符所做出的点击操作时,将所述目标附图在所述目标显示页面的相邻页面显示。
8.如权利要求1至7中任一项所述的文档拼接方法,其特征在于,所述对所述目标图片进行文字识别,得到识别文档的步骤包括:
对所述目标图片进行字符识别,获取所述目标图片中的目标文字,得到识别文档。
9.如权利要求8所述的文档拼接方法,其特征在于,所述获取所述目标图片中的目标文字,得到识别文档的步骤包括:
获取用户输入的文字段落信息,根据所述文字段落信息对目标文字进行排版,得到识别文档。
10.如权利要求1至7中任一项所述的文档拼接方法,其特征在于,所述对所述目标图片进行文字识别,得到识别文档的步骤包括:
对所述目标图片依次进行识别,获取所述目标图片中所有文字的文字参数;
根据所述文字参数,判断所述所有文字中是否存在差异文字;
若所述所有文字中存在所述差异文字,则对所述差异文字对应的识别文字进行标记,得到识别文档。
11.如权利要求10所述的文档拼接方法,其特征在于,所述根据所述文字参数,判断所述所有文字中是否存在差异文字的步骤包括:
计算每种文字参数占所有文字参数的比例;
若存在比例小于或等于预设阈值的目标文字参数,则将所述目标文字参数对应的文字作为差异文字。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于深圳传音控股股份有限公司,未经深圳传音控股股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010860455.6/1.html,转载请声明来源钻瓜专利网。