[发明专利]模型训练、管状物提取、数据识别方法及设备有效
申请号: | 201910982976.6 | 申请日: | 2019-10-16 |
公开(公告)号: | CN112668710B | 公开(公告)日: | 2022-08-05 |
发明(设计)人: | 许敏丰;王宇;迟颖;谢宣松 | 申请(专利权)人: | 阿里巴巴集团控股有限公司 |
主分类号: | G06N3/08 | 分类号: | G06N3/08 |
代理公司: | 北京太合九思知识产权代理有限公司 11610 | 代理人: | 柴艳波;刘戈 |
地址: | 英属开曼群岛大开*** | 国省代码: | 暂无信息 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 模型 训练 管状 提取 数据 识别 方法 设备 | ||
本申请实施例提供一种模型训练、管状物提取、数据识别方法及设备。其中,方法包括如下的步骤:利用计算模型,预测出第一样本数据分别属于至少一个可能类别的概率;其中,所述第一样本数据为从包含有第一样本管状物影像的第一样本图像中确定出的第一样本区域;根据所述第一样本数据分别属于至少一个可能类别的概率,评估所述计算模型预测的不确定性;结合所述不确定性,对所述计算模型进行参数优化;其中,所述计算模型用于在待处理图像中提取出待提取管状物。采用本申请实施例提供的技术方案,可利用掺杂有被噪声类别标注的样本的训练集来训练计算模型,不仅可大幅度降低训练集的标注成本,还可确保计算模型的训练效果。
技术领域
本申请涉及计算机技术领域,尤其涉及一种模型训练、管状物提取、数据识别方法及设备。
背景技术
目前,神经网络模型被广泛应用在多个领域,例如:机器人领域、医学领域。
现有技术中,需要通过人工标注的方式对大量的训练样本进行精确标注,利用精确标注的训练样本来训练神经网络,才能够确保最终训练得到的神经网络的预测精度。然而,这种精确标注的要求无疑会增大标注人员的工作量以及增大对标注人员的能力要求,例如:医学领域中对肝脏血管、心脑血管等进行标注时,需要专业的医学人士花费大量的时间来标注。
可见,现有的训练方法存在训练成本大等技术问题。
发明内容
鉴于上述问题,提出了本申请以提供一种解决上述问题或至少部分地解决上述问题的模型训练、管状物提取、数据识别方法及设备。
于是,在本申请的一个实施例中,提供了一种模型训练方法。该方法包括:
利用计算模型,预测出第一样本数据分别属于至少一个可能类别的概率;其中,所述第一样本数据为从包含有第一样本管状物影像的第一样本图像中确定出的第一样本区域;
根据所述第一样本数据分别属于至少一个可能类别的概率,评估所述计算模型预测的不确定性;
结合所述不确定性,对所述计算模型进行参数优化;其中,所述计算模型用于在待处理图像中提取出待提取管状物。
在本申请的另一个实施例中,提供了一种管状物提取方法。该方法包括:
获取包含有管状物影像的待处理图像;
利用训练好的计算模型,从所述待处理图像中提取出所述管状物;其中,所述计算模型的训练过程如下:
利用计算模型,预测出第一样本数据分别属于至少一个可能类别的概率;其中,所述第一样本数据为从包含有第一样本管状物影像的第一样本图像中确定出的第一样本区域;
根据所述第一样本数据分别属于至少一个可能类别的概率,评估所述计算模型预测的不确定性;
结合所述不确定性,对所述计算模型进行参数优化。
在本申请的另一个实施例中,提供了一种模型训练方法。该方法包括:
根据第一样本数据,利用计算模型预测出所述第一样本数据分别属于至少一个可能类别的概率;
根据所述第一样本数据分别属于至少一个可能类别的概率,评估所述计算模型预测的不确定性;
结合所述不确定性,对所述计算模型进行参数优化;
其中,所述计算模型用以识别待处理数据。
在本申请的另一个实施例中,提供了一种数据识别方法。该方法包括:
获取待处理数据;
利用训练好的计算模型,对所述待处理数据进行识别;其中,所述计算模型的训练过程如下:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于阿里巴巴集团控股有限公司,未经阿里巴巴集团控股有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910982976.6/2.html,转载请声明来源钻瓜专利网。