[发明专利]一种基于AI的可变尺度地质图文本矢量化方法及系统有效
申请号: | 202010145454.3 | 申请日: | 2020-03-03 |
公开(公告)号: | CN111400524B | 公开(公告)日: | 2023-05-26 |
发明(设计)人: | 高光大;王茂发;李景朝 | 申请(专利权)人: | 中国地质大学(北京) |
主分类号: | G06F16/53 | 分类号: | G06F16/53;G06F16/56;G06F16/583;G06N3/0464;G06N3/0442;G06T7/11 |
代理公司: | 北京冠和权律师事务所 11399 | 代理人: | 张楠楠 |
地址: | 100084*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 ai 可变 尺度 地质图 文本 矢量 方法 系统 | ||
本发明提供了一种基于AI的可变尺度地质图文本矢量化方法及系统,其中,方法包括:获取可变尺度格栅地质图,并构建图像素材集合;基于动态参考坐标系,对构建的图像素材集合中的格栅地质图进行图像倾斜角度的动态校正,并输出水平走向的格栅图像;基于多尺度可分割目标检测算法,对输出的格栅图像中的格栅文本进行定位和提取,并输出文本格栅信息;基于词向量表示算法对输出的文本格栅信息进行矢量化识别,输出与文本格栅信息对应的文本矢量及每个格栅文本对应的坐标点信息;将文本矢量和对应的坐标点信息保存至非关系型数据库,并导入全文检索引擎,构建可变尺度格栅地质图的文本信息检索系统。提高了地质图文本信息提取的体验。
技术领域
本发明涉及人工智能技术领域,特别涉及一种基于AI的可变尺度地质图文本矢量化方法及系统。
背景技术
在地质图领域,由于存在大量的素材,有大量的地理信息,其主要呈现形式又以文本字符为主,图像本身背景复杂、光照与角度多变,加之文本语种繁多、字体尺度方向等多变,最终导致检测与识别精度难以达到应用的需求。
而针对格栅地质图的文本信息提取与检索,目前还没有比较系统的方案能够对现有的地质图进行妥善、精确地处理语文本信息提取,普遍都是依靠人力进行查询与操作,也没有一个产品对地质图进行有效的格栅化处理并提取矢量化的文本信息,无法全面和系统的获取到完成对地质图从格栅化到最后文本信息提取的全部处理过程。
因此,需要提出基于格栅的文本矢量化检索方法,解决上述问题。
发明内容
本发明提供一种基于AI的可变尺度地质图文本矢量化方法及系统,用以解决现有技术中图像本身背景复杂、光照与角度多变,加之文本语种繁多、字体尺度方向等多变,而导致检测与识别精度难以达到实际应用的需求的缺陷。
本发明实施例提供一种基于AI的可变尺度地质图文本矢量化方法,包括:
获取可变尺度格栅地质图,并构建图像素材集合;
基于动态参考坐标系,对构建的图像素材集合中的格栅地质图进行图像倾斜角度的动态校正,并输出水平走向的格栅图像;
基于多尺度可分割目标检测算法,对输出的所述格栅图像中的格栅文本进行定位和提取,并输出文本格栅信息;
基于词向量表示算法对输出的所述文本格栅信息进行矢量化识别,输出与所述文本格栅信息对应的文本矢量及每个格栅文本对应的坐标点信息;
将文本矢量和对应的坐标点信息保存至非关系型数据库,并导入全文检索引擎,构建可变尺度格栅地质图的文本信息检索系统。
优选地,所述获取可变尺度格栅地质图,并构建图像素材集合之后包括:
按照预设比例,对所述图像素材集合进行分类处理,获得若干分类子集合;
对不同所述分类子集合中的每张格栅地质图建立与之同名的预设文件,为文本矢量化检索做准备。
优选地,所述基于动态参考坐标系,对构建的图像素材集合中的格栅地质图进行图像倾斜角度的动态校正,并输出水平走向的格栅图像的步骤包括:
根据文本走向水平或者沿同一方向倾斜的格栅地质图,确定第一参考坐标系,并基于倾斜校正方法,对文本走向水平或者沿同一方向倾斜的格栅地质图进行水平校正,并输出;
根据文本走向不一的格栅地质图,动态建立若干个第二参考坐标系,实现对文本走向不一的格栅地质图的动态校正,并输出;
其中,基于所述第一参考坐标系和第二参考坐标系的两个轴向长度,确定所述格栅图像对应的文本区域的分割范围。
优选地,所述基于多尺度可分割目标检测算法,对输出的所述格栅图像中的格栅文本进行定位和提取,并输出文本格栅信息的步骤包括:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国地质大学(北京),未经中国地质大学(北京)许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010145454.3/2.html,转载请声明来源钻瓜专利网。