[发明专利]无线条流水文件的转换方法、装置、设备及存储介质在审

专利信息
申请号: 202210535864.8 申请日: 2022-05-17
公开(公告)号: CN115050041A 公开(公告)日: 2022-09-13
发明(设计)人: 李潇;戴彪 申请(专利权)人: 上海孚厘科技有限公司
主分类号: G06V30/413 分类号: G06V30/413;G06V30/18;G06V30/162;G06F40/18;G06Q40/02
代理公司: 深圳市世纪恒程知识产权代理事务所 44287 代理人: 袁雪
地址: 201900 上海市*** 国省代码: 上海;31
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 线条 流水 文件 转换 方法 装置 设备 存储 介质
【权利要求书】:

1.一种无线条流水文件的转换方法,其特征在于,所述无线条流水文件的转换方法包括以下步骤:

对待转换的目标格式无线条流水文件进行页面分割,得到目标无线条流水图片;

对所述目标无线流水图片进行结构元素识别,得到连续文字轮廓;

根据预设高度系数、预设行系数、预设间隔系数以及所述连续文字轮廓确定行分组结构文字数据和空白列;

根据所述行分组结构文字数据和所述空白列生成目标结构文字数据,并按照目标数据写入策略将所述目标结构数据写入至目标线条文件。

2.如权利要求1所述的无线条流水文件的转换方法,其特征在于,所述对待转换的目标格式无线条流水文件进行页面分割,得到目标无线条流水图片,包括:

对待转换的目标格式无线条流水文件进行页面分割,得到若干页目标格式无线条流水文件;

按照目标倍数对所述若干页目标格式无线条流水文件进行缩放;

对缩放后的若干页目标格式无线条流水文件进行转换,得到目标无线条流水图片。

3.如权利要求2所述的无线条流水文件的转换方法,其特征在于,所述对待转换的目标格式无线条流水文件进行页面分割,得到若干页目标格式无线条流水文件之前,还包括:

接收终端设备发出的电子版无线条流水文件;

对所述电子版无线条流水文件进行扫描,得到无线条流水扫描文件;

在所述无线条流水扫描文件满足预设文字辨识缺陷时,将所述无线条流水扫描文件作为待转换的目标格式无线条流水文件。

4.如权利要求1所述的无线条流水文件的转换方法,其特征在于,所述对所述目标无线流水图片进行结构元素识别,得到连续文字轮廓,包括:

对所述目标无线流水图片进行通道拆分,得到目标数量通道;

提取所述目标数量通道的红色通道;

根据所述红色通道对所述目标无线流水图片进行二值化处理,得到黑底白字的二值化无线流水图片;

根据otsu阈值通过opencv图像算法对所述黑底白字的二值化无线流水图片进行结构元素识别,得到连续文字轮廓。

5.如权利要求1所述的无线条流水文件的转换方法,其特征在于,所述根据预设高度系数、预设行系数、预设间隔系数以及所述连续文字轮廓确定行分组结构文字数据和空白列,包括:

根据所述连续文字轮廓得到对应的连续文字轮廓高度;

对所述连续文字轮廓高度小于所述预设高度系数的连续文字轮廓进行筛选;

按照目标顺序关系对筛选后的连续文字轮廓进行排序;

根据排序后的连续文字轮廓得到对应的当前轮廓纵坐标和上一轮廓纵坐标;

将所述当前轮廓纵坐标和所述上一轮廓纵坐标进行作差计算,得到轮廓纵坐标差值;

在所述轮廓纵坐标差值大于预设行系数时,得到各行连续文字轮廓;

根据所述各行连续文字轮廓得到当前轮廓横坐标和相邻轮廓横坐标;

将所述当前轮廓横坐标和所述相邻轮廓横坐标进行作差计算,得到轮廓横坐标差值;

在所述轮廓横坐标差值小于预设间隔系数时,将所述当前轮廓横坐标对应的文字轮廓和相邻轮廓横坐标对应的轮廓进行合并,得到目标横坐标轮廓;

根据所述各行连续文字轮廓和所述目标横坐标轮廓生成行分组结构文字数据;

根据所述行分组结构文字数据得到对应的空白列。

6.如权利要求5所述的无线条流水文件的转换方法,其特征在于,所述根据所述行分组结构文字数据得到对应的空白列,包括:

根据所述行分组结构文字数据得到列数次数集合;

提取所述列数次数集合中的最高次数列数;

获取待转换的目标格式无线条流水文件的标题总列数量;

对所述最高次数列数进行迭代,得到目标列的左上横坐标;

根据所述标题总列数量得到标题行的下一列的右上横坐标;

在所述目标列的左上横坐标大于所述标题行的下一列的右上横坐标时,将所述目标列作为空白列。

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于上海孚厘科技有限公司,未经上海孚厘科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/202210535864.8/1.html,转载请声明来源钻瓜专利网。

同类专利
专利分类
×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top