[发明专利]一种批量化学术图像自动分割标注装置和方法有效
申请号: | 202110940037.2 | 申请日: | 2021-08-17 |
公开(公告)号: | CN113392819B | 公开(公告)日: | 2022-03-08 |
发明(设计)人: | 王帅;唐文忠;冯浩楠;钱程 | 申请(专利权)人: | 北京航空航天大学 |
主分类号: | G06V30/413 | 分类号: | G06V30/413;G06V10/28 |
代理公司: | 北京天汇航智知识产权代理事务所(普通合伙) 11987 | 代理人: | 黄川;史继颖 |
地址: | 100191*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 批量 化学 图像 自动 分割 标注 装置 方法 | ||
本发明公开了一种批量化学术图像自动分割标注装置和方法,包括:图像获取模块,读取图像;阈值处理模块,将图像转化为灰度图,并根据设定阈值进一步转化为二值图;边缘提取模块,在二值图上寻找闭合轮廓,获得初始轮廓信息;边缘过滤模块,对每一个闭合轮廓做外接矩形,以外接矩形的面积为依据进行轮廓的筛选,得到符合要求的轮廓信息;边缘修补模块,对选定的轮廓进行整合,得到最终合适的轮廓,确定最终的分割区域;图像分割模块,依据最终确定的分割区域对图像进行分割,输出各分割区域的位置信息并形成标注文件保存下来;类别标注模块,用于将各分割区域输入到卷积神经网络中进行自动分类,生成类别标签,从而完善标注文件。
技术领域
本发明涉及一种对论文中的学术图像按照内容进行自动分割并标注的实现方法,特别是在对海量的学术图像进行批量化的处理过程中,针对学术图像内部排版不规则、子图类型繁多等特点,提出的一种能批量化处理,尽量去除文字等干扰因素,只保留子图像,同时根据内容对子图像进行分类的图像自动分割和标注方法。
背景技术
图像分割是数字图像处理和计算机视觉领域中的一项关键技术,同时也是图像分析、图像识别任务中至关重要的预处理环节。在对图像的研究和应用中,由于人眼的视觉特性,往往只对图像中的某一部分或某些特定的区域感兴趣,为了便于识别和分析,需要将这些感兴趣的区域提取出来。而图像分割就是依据灰度、彩色、空间纹理、几何形状等特征把图像划分成若干个几何上互不相交的区域,使得这些特征在同一区域内表现出一致性或相似性,而在不同区域间表现出明显的不同。但是图像分割技术发展至今仍然没有形成一个统一的技术规范,在不同的实际需求和应用场景下,图像分割的具体方式都需要进行相应的调整,所以图像分割技术还是需要持续的进行研究。
目前常见的图像分割任务都是基于自然图像的,对于出现在论文中的学术图像并没有进行充分的研究。不同于自然图像本身就包含丰富的颜色、形状、纹理等信息,学术图像是体现研究成果的载体,特别是在生物医学领域,论文作者往往将多张不同类型的图像通过组合、拼接、排列等方式整合为一张复合图像进行呈现,导致之后在进行图像匹配分析时存在大量的误匹配,即不同类型的子图相互之间存在大量的干扰。要避免这一现象的发生,关键在于将各张子图从一张复合图像中分割出来。
针对学术图像分割这种现实需要,目前的研究还不够充分,虽然传统的图像分割方法如阈值分割法和边缘检测分割法对于解决这个问题是可行的,但是对于较为特殊的学术图像而言,这些方法尚存在一定的局限性或者应用上难以达到令人满意的效果。
一是学术图像的阈值难以确定。通常对图像的操作都是要先将图像转化为灰度图,这样便于后续的处理,而在学术图像的应用背景下,需要先将一张图像中有内容的区域识别出来,其次才是对识别区域的分析标注。为了加大内容区域和背景的辨别程度,需要对学术图像进行二值化的处理,而常用的经验阈值并不能良好的区分内容区域和背景,就拿生物医学领域论文中经常出现的条带图来说,有的条带图背景很浅,比较接近于整张图像背景,所以对于学术图像的阈值选取需要重新确定。
二是现有方法应用的适应性不是很强。一张学术图像内部可能包含若干张子图,而这些子图的布局并不都是有规律可循的,应用边缘检测法虽然能够将图像内有内容的区域描绘检测出来,但是有时学术图像并不具备较高的分辨率,也就是说有的学术图像可能并不是很清晰,会存在一些噪声点导致图像的质量下降,而边缘检测法会将所有有内容的区域都检测出来,其中会包含一些噪声点或者出现一些零零散散的区域,而这些的存在就是干扰,会导致分割效果的下降。所以需要对检测出来的边缘轮廓进行合理的筛查,这样才能过滤掉一些如噪点之类的会对有效内容区域进行干扰的因素,从而提高学术图像分割的质量和准确度。另外,目前还缺乏对于学术图像的标注数据集,对于分割后的图像进行自动分类也有助于构建学术图像数据集,对于数据集也是一种补充。
发明内容
本发明的目的是提供一种能批量化进行的学术图像自动分割并标注的实现方法,解决学术图像中广泛存在的子图布局不规则,图像质量较低的问题,以及对现有边缘检测方法对于学术图像存在误检、错检的情况提出相应的改进措施。具体技术方案如下:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京航空航天大学,未经北京航空航天大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110940037.2/2.html,转载请声明来源钻瓜专利网。
- 彩色图像和单色图像的图像处理
- 图像编码/图像解码方法以及图像编码/图像解码装置
- 图像处理装置、图像形成装置、图像读取装置、图像处理方法
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序以及图像解码程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序、以及图像解码程序
- 图像形成设备、图像形成系统和图像形成方法
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序