[发明专利]基于多通道结构的消化道内窥镜图片病灶识别系统在审
申请号: | 202110568218.7 | 申请日: | 2021-05-25 |
公开(公告)号: | CN113034500A | 公开(公告)日: | 2021-06-25 |
发明(设计)人: | 戴捷;李亮 | 申请(专利权)人: | 紫东信息科技(苏州)有限公司 |
主分类号: | G06T7/00 | 分类号: | G06T7/00;G06T7/11;G06K9/46;G06N3/04;G06N3/08;G16H30/20 |
代理公司: | 北京金讯知识产权代理事务所(特殊普通合伙) 11554 | 代理人: | 黄剑飞 |
地址: | 215123 江苏省苏州市工业*** | 国省代码: | 江苏;32 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 通道 结构 消化道 内窥镜 图片 病灶 识别 系统 | ||
1.一种基于多通道结构的消化道内窥镜图片病灶识别系统,其包括:
训练数据获取标注模块,用于获取多组训练数据,每组训练数据包括消化道内窥镜图片和消化道内窥镜图片的病灶类别和病灶区域;
预处理模块,用于对所述消化道内窥镜图片进行预处理,得到处理后的消化道内窥镜图片;
模型构建模块,用于构建预设的网络模型,所述预设的网络模型包括多个并行的不同粒度通道网络,与所述多个并行的不同粒度通道网络全部相连的共享解码网络;所述多个并行的不同粒度通道网络均由图片切割层和多层Transformer构成,用于抽取消化道内窥镜图片的图片特征;所述共享解码网络由卷积神经网络构成,用于解码消化道内窥镜图片特征,输出消化道内窥镜图片病灶定位及分类预测;
模型训练模块,用于将所述处理后的消化道内窥镜图片输入预设的网络模型,并使用预设的损失函数对所述网络模型进行训练,得到识别模型;
识别模块,用于利用所述识别模型结合非极大值抑制算法对输入的消化道内窥镜图片进行识别。
2.根据权利要求1所述的系统,其中所述Transformer至少包括用于获取序列特征的多头注意力部分、用于非线性变换的前馈传播部分和用于归一化的加和标准化部分,前馈传播部分位于多头注意力部分之后,在前馈传播部分和多头注意力部分的输出位置分别构建加和标准化部分。
3.根据权利要求1所述的系统,其中对消化道内窥镜图片进行预处理包括:缩放裁剪处理、去均值处理、归一化处理之一或其任意组合。
4.根据权利要求1所述的系统,其中所述的多个并行的不同粒度通道网络中的图片切割层对所述的消化道内窥镜图片进行不同粒度切割。
5.根据权利要求1所述的系统,其中所述的共享解码网络可由全连接神经网络实现。
6.根据权利要求1所述的系统,其中所述预设的损失函数为:
其中, 为像素点类别输出,为类别标签,为像素点的位置输出,为位置标签,为类别误差,采用焦点损失Focal Loss计算,Lreg为位置误差,采用IoU损失计算,Npos表示像素点的数量, 为指示器,当时等于1,否则等于0,为Lreg的平衡因子。
7.根据权利要求1所述的系统,其中所述消化道内窥镜图片的病灶类别包括:胃癌、胃溃疡、胃炎、胃糜烂、十二指肠溃疡之一或其任意组合。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于紫东信息科技(苏州)有限公司,未经紫东信息科技(苏州)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110568218.7/1.html,转载请声明来源钻瓜专利网。