[发明专利]一种用于构建图半监督学习模型的方法和系统在审

专利信息
申请号: 202010428382.3 申请日: 2020-05-20
公开(公告)号: CN111612062A 公开(公告)日: 2020-09-01
发明(设计)人: 刘世霞;陈长建;王兆伟;李宇峰 申请(专利权)人: 清华大学;南京大学
主分类号: G06K9/62 分类号: G06K9/62
代理公司: 北京清亦华知识产权代理事务所(普通合伙) 11201 代理人: 石茵汀
地址: 10008*** 国省代码: 北京;11
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 一种 用于 构建 监督 学习 模型 方法 系统
【说明书】:

发明公开了一种用于构建图半监督学习模型的方法、计算机系统以及计算机可读存储介质。根据该方法,利用多个训练样本中的任意两个训练样本之间的距离,构建一个图结构,将所述图结构作为更新后的图结构;对于所述更新后的图结构,循环执行如下步骤:获得所述更新后的图结构中的一个子图结构;利用所述多个训练样本中的任意两个训练样本之间的距离,在指定的可选k值范围内,获得所述子图结构的最优k值;根据所述最优k值更新所述子图结构,从而获得再次更新后的图结构;响应于不需要获得所述再次更新后的图结构的一个子图结构,训练所述再次更新后的图结构对应的图半监督学习模型。

技术领域

本发明涉及机器学习,特别地,本发明涉及一种用于构建图半监督学习模型的方法、计算机系统以及计算机可读存储介质。

技术背景

在大数据时代,有监督学习在很多领域都取得了巨大的成功,如人脸识别、个性化推荐等。然而在很多领域,比如医学领域,数据标注的代价要远大数据获取的代价。这导致了无标注数据的数据量要远多于有标注数据的数据量。半监督学习能够有效同时利用有标注数据和无标注数据来提高分类性能。其中一种常用的半监督学习模型是图半监督学习模型。现有技术中,图半监督学习模型在现实应用中被广泛使用,例如医学数据、图像数据、表格数据、文本数据等。

发明内容

以下描述包括体现本发明技术的示例性方法、系统、技术和指令序列。然而,应该理解,在一个或多个方面,可以在没有这些具体细节的情况下实践所描述的发明。在其他情况下,没有详细示出公知的协议、结构和技术,以免模糊本发明。本领域普通技术人员将理解,所描述的技术和机制可以应用于构建图半监督学习模型的各种体系结构。

根据本发明的一个方面,提出了一种用于构建图半监督学习模型的方法,该方法包括:利用多个训练样本中的任意两个训练样本之间的距离,构建一个图结构,将所述图结构作为更新后的图结构;对于循环中每一次的更新后的图结构,执行如下步骤:获得所述更新后的图结构中的一个子图结构;利用所述多个训练样本中的任意两个训练样本之间的距离,在指定的可选k值范围内,获得所述子图结构的最优k值;根据所述最优k值更新所述子图结构,从而获得再次更新后的图结构;响应于不需要获得所述再次更新后的图结构的一个子图结构,训练所述再次更新后的图结构对应的图半监督学习模型。

根据本发明的另一个方面,提出了一种用于构建图半监督学习模型的计算机可读存储介质,所述计算机可读存储介质具有存储其中的程序指令,所述程序指令可由计算设备执行以使得计算设备执行如上所述的方法。

根据本发明的又一个方面,提出了一种用构建图半监督学习模型的系统,包括:存储器;以及至少一个处理器,该至少一个处理器可操作地耦合到所述存储器并配置用于执行如上所述的方法。

根据本发明的再一个方面,提出了一种用于构建图半监督学习模型的计算机系统,所述系统包括分别用于执行如上所述的方法的各个步骤的模块。

附图说明

通过参照附图阅读下面对说明性实施例的详细说明可更好地理解发明本身以及其优选使用模式、目标、特征以及优点,在附图中:

图1示出了某医院同时利用有标注样本和无标注样本对检测报告进行分类的示例;

图2示出了利用k近邻构建图结构方法构建的一个图结构的示例;

图3示出了根据本发明的一个或多个实施例的一种用于构建图半监督学习模型的方法的流程图;

图4示出了根据本发明的一个或多个实施例的一种利用获得最大平均间隔来确该子图结构的最优k值的方法的流程图;

图5A、图5B、图5C示出了图4所示的方法的步骤410的一个示例的不同处理阶段;

图6示出了根据本发明的一个或多个实施例的一种利用候选图结构,获得一个特定k值对应的多个训练样本中各个训练样本的间隔的平均间隔的方法的流程图;

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于清华大学;南京大学,未经清华大学;南京大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/202010428382.3/2.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top