[发明专利]印刷品文字的校对方法及相关设备有效
申请号: | 202011464953.5 | 申请日: | 2020-12-14 |
公开(公告)号: | CN112232320B | 公开(公告)日: | 2021-05-25 |
发明(设计)人: | 陈越;郑志凯;柳少华;朱海亮;李默;王林芳;梅涛 | 申请(专利权)人: | 北京沃东天骏信息技术有限公司;北京京东世纪贸易有限公司 |
主分类号: | G06K9/00 | 分类号: | G06K9/00;G06K9/32;G06K9/34;G06N3/04;G06N3/08 |
代理公司: | 北京律智知识产权代理有限公司 11438 | 代理人: | 孙宝海;袁礼君 |
地址: | 100176 北京市大兴区北京经济*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 印刷品 文字 校对 方法 相关 设备 | ||
1.一种印刷品文字的校对方法,其特征在于,包括:
获取印刷品的标准文本,其中,所述标准文本按照说明内容划分为不同部分;
对所述标准文本进行解析以获得所述标准文本的不同部分的文本内容;
获取所述印刷品的设计稿,其中,所述印刷品的设计稿为图片;
对所述设计稿进行区域检测从而得到所述设计稿的各个文本区域;
从所述设计稿的各个文本区域提取识别文字;
将所述各个文本区域的识别文字与所述标准文本的各个部分的文本内容进行对比以对所述设计稿的文字进行校对;
其中,对所述设计稿进行区域检测从而得到所述设计稿的各个文本区域包括:
通过基于深度残差网络50的快速区域卷积网络模型及引入特征金字塔网络框架构建的检测模型来对所述设计稿进行区域检测从而得到所述设计稿的各个文本区域;
其中,从所述设计稿的各个文本区域提取识别文字包括:
通过对深度残差网络18模型使用图网进行预训练获得的识别网络模型识别所述设计稿的各个文本区域中文字的方向;
根据所述设计稿的各个文本区域中文字的方向将所述设计稿的各个文本区域中文字调整为自左向右的正常阅读的方向;
将所述设计稿的各个文本区域中文字调整为自左向右的正常阅读的方向后,通过基于深度残差网络101的快速区域卷积网络模型及引入特征金字塔网络框架构建的检测模型获取所述设计稿的各个文本区域中文字的字符区域;
在获取所述设计稿的各个文本区域中文字的字符区域后,根据字符在纵向的重合程度确定所述设计稿的文本区域中的文字行。
2.根据权利要求1所述的方法,其特征在于,对所述标准文本进行解析以获得所述标准文本的不同部分的文本内容包括:
使所述标准文本的不同部分在所述标准文本的文本内容中以行或段进行显示。
3.根据权利要求1所述的方法,其特征在于,对所述设计稿进行区域检测从而得到所述设计稿的各个文本区域包括:
在用户对所述设计稿的文本区域进行调整时,获取所述用户调整后的所述设计稿的各个文本区域。
4.根据权利要求1所述的方法,其特征在于,从所述设计稿的各个文本区域提取识别文字包括:
在根据字符在纵向的重合程度确定所述设计稿的各个文本区域中的文字行过程中,若存在与多个参照字符的重叠程度大于特定值的字符,则提醒用户重新框选与该字符相关的文本区域。
5.根据权利要求1所述的方法,其特征在于,将所述各个文本区域的识别文字与所述标准文本的各个部分的文本内容进行对比以对所述设计稿的文字进行校对包括:
以文字行为单位将所述各个文本区域的识别文字与所述标准文本的各个部分的文本内容进行对比以对所述设计稿的文字进行校对。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京沃东天骏信息技术有限公司;北京京东世纪贸易有限公司,未经北京沃东天骏信息技术有限公司;北京京东世纪贸易有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202011464953.5/1.html,转载请声明来源钻瓜专利网。