[发明专利]一种基于弱监督学习的舌体图像分割方法有效
申请号: | 202010058500.6 | 申请日: | 2020-01-19 |
公开(公告)号: | CN111242940B | 公开(公告)日: | 2023-05-30 |
发明(设计)人: | 张文强 | 申请(专利权)人: | 复旦大学 |
主分类号: | G06T7/00 | 分类号: | G06T7/00;G06T7/11;G06T7/13 |
代理公司: | 上海科盛知识产权代理有限公司 31225 | 代理人: | 叶敏华 |
地址: | 200433 *** | 国省代码: | 上海;31 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 监督 学习 图像 分割 方法 | ||
本发明涉及一种基于弱监督学习的舌体图像分割方法,包括步骤:1)采集大量的含有舌体的原始图像,对原始图像选择性搜索,获取大量的候选框;2)对原始图像进行随机数据增强,并采用分类网络进行训练,利用训练后的分类网络对获取的大量候选框进行评分,以对候选框进行筛选;3)对步骤2)筛选的候选框集合进行优化,获取最终的舌体边界框;4)对最终的边界框内的图像进行边缘检测;5)对边缘检测得到的检测图像采用Grabcut进行分割,获取最终的舌体分割结果。与现有技术相比,本发明既不需要大量的带像素级标签的训练数据,又能实现精细的舌体分割,在一定程度上解决了数据成本较大和泛化性差的问题,且同时具有较高的分割精度。
技术领域
本发明涉及计算机视觉图像处理技术领域,尤其是涉及一种基于弱监督学习的舌体图像分割方法。
背景技术
舌体图像分割是整个舌诊量化系统最重要的步骤,由于舌体的近似半椭圆形的结构,矩形的图像采集区域会包含很多非舌体的背景,舌体图像分割的主要工作就是将舌体从人的脸部、嘴巴及牙齿等背景中准确分割出来,在此基础上进行后续的舌象分类。如果舌体图像没有准确分割出来,特征提取的结果就会产生较大差异,导致后续训练舌象分类器的效果不理想。所以需要在包含其他背景的舌体图像把舌体精细的分割出来。
关于舌体分割的算法目前来说主要有两大类,一类是传统的无监督算法,其优点是不需要任何标签直接进行分割,简单快捷,但是其分割的质量残差不齐,泛化性太差,分割效果难以保证达到后续舌诊的要求。第二类是全监督的语义分割,该类算法需要事先得到像素级的人工标签,也就是需要手工把输入图像上所有像素点是属于前景还是属于背景标注出来,前景标注为白色,背景标注为黑色,即希望模型能够得到的分割结果,相当于考试中的参考答案。该类算法的优点在于分割效果良好,数据越多,效果越好,缺点在于一是需要大量的数据才能训出比较好的效果,二是像素级的标签十分耗时耗力,对大量数据集进行标注需要较高的成本。
发明内容
本发明的目的就是为了克服上述现有技术存在的缺陷而提供一种基于弱监督学习的舌体图像分割方法。
本发明的目的可以通过以下技术方案来实现:
一种基于弱监督学习的舌体图像分割方法,具体包括如下步骤:
S1、采集大量的含有舌体的原始图像,对原始图像选择性搜索,获取大量的候选框。
利用Graph算法对原始图像进行预分割,获取大量区域,随后寻找相似度最高的两个相邻区域并将其合并为新区域,迭代直至无法继续合并,新区域集合即为获得的候选框。
S2、对原始图像进行随机数据增强,并采用分类网络进行训练,利用训练后的分类网络对获取的大量候选框进行评分,以对候选框进行筛选。对原始图像进行随机数据增强的具体内容为:
对原始图像的以下扩充数据随机组合,扩充数据包括:将原始图像的旋转角度从-30度转换至30度,将原始图像的焦距从80%变更至到120%,将原始图像的高斯模糊的标准差从0.25变更至0.5,高斯噪声系数为0.03。
采用分类网络进行训练,利用训练后的分类网络对获取的大量候选框进行评分的具体内容为:
21)以原始图像作为输入,经过卷积操作得到初始特征图;
22)以候选框和初始特征图为输入,通过空间金字塔池化操作得到候选框区域的特征图,随后继续进行公共卷积操作,获取最新的特征图;
23)将最新的特征图分别通过卷积操作和softmax函数得到两个得分,求取两个得分的内积作为最终得分,最终得分的分值越高,表示候选框中包含的舌头的概率越大。
优选地,分类网络损失函数采用带L2正则项的交叉熵损失函数,其表达式为:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于复旦大学,未经复旦大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010058500.6/2.html,转载请声明来源钻瓜专利网。
- 彩色图像和单色图像的图像处理
- 图像编码/图像解码方法以及图像编码/图像解码装置
- 图像处理装置、图像形成装置、图像读取装置、图像处理方法
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序以及图像解码程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序、以及图像解码程序
- 图像形成设备、图像形成系统和图像形成方法
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序