[发明专利]一种用于构建图半监督学习模型的方法和系统在审
申请号: | 202010428382.3 | 申请日: | 2020-05-20 |
公开(公告)号: | CN111612062A | 公开(公告)日: | 2020-09-01 |
发明(设计)人: | 刘世霞;陈长建;王兆伟;李宇峰 | 申请(专利权)人: | 清华大学;南京大学 |
主分类号: | G06K9/62 | 分类号: | G06K9/62 |
代理公司: | 北京清亦华知识产权代理事务所(普通合伙) 11201 | 代理人: | 石茵汀 |
地址: | 10008*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 用于 构建 监督 学习 模型 方法 系统 | ||
本发明公开了一种用于构建图半监督学习模型的方法、计算机系统以及计算机可读存储介质。根据该方法,利用多个训练样本中的任意两个训练样本之间的距离,构建一个图结构,将所述图结构作为更新后的图结构;对于所述更新后的图结构,循环执行如下步骤:获得所述更新后的图结构中的一个子图结构;利用所述多个训练样本中的任意两个训练样本之间的距离,在指定的可选k值范围内,获得所述子图结构的最优k值;根据所述最优k值更新所述子图结构,从而获得再次更新后的图结构;响应于不需要获得所述再次更新后的图结构的一个子图结构,训练所述再次更新后的图结构对应的图半监督学习模型。
技术领域
本发明涉及机器学习,特别地,本发明涉及一种用于构建图半监督学习模型的方法、计算机系统以及计算机可读存储介质。
技术背景
在大数据时代,有监督学习在很多领域都取得了巨大的成功,如人脸识别、个性化推荐等。然而在很多领域,比如医学领域,数据标注的代价要远大数据获取的代价。这导致了无标注数据的数据量要远多于有标注数据的数据量。半监督学习能够有效同时利用有标注数据和无标注数据来提高分类性能。其中一种常用的半监督学习模型是图半监督学习模型。现有技术中,图半监督学习模型在现实应用中被广泛使用,例如医学数据、图像数据、表格数据、文本数据等。
发明内容
以下描述包括体现本发明技术的示例性方法、系统、技术和指令序列。然而,应该理解,在一个或多个方面,可以在没有这些具体细节的情况下实践所描述的发明。在其他情况下,没有详细示出公知的协议、结构和技术,以免模糊本发明。本领域普通技术人员将理解,所描述的技术和机制可以应用于构建图半监督学习模型的各种体系结构。
根据本发明的一个方面,提出了一种用于构建图半监督学习模型的方法,该方法包括:利用多个训练样本中的任意两个训练样本之间的距离,构建一个图结构,将所述图结构作为更新后的图结构;对于循环中每一次的更新后的图结构,执行如下步骤:获得所述更新后的图结构中的一个子图结构;利用所述多个训练样本中的任意两个训练样本之间的距离,在指定的可选k值范围内,获得所述子图结构的最优k值;根据所述最优k值更新所述子图结构,从而获得再次更新后的图结构;响应于不需要获得所述再次更新后的图结构的一个子图结构,训练所述再次更新后的图结构对应的图半监督学习模型。
根据本发明的另一个方面,提出了一种用于构建图半监督学习模型的计算机可读存储介质,所述计算机可读存储介质具有存储其中的程序指令,所述程序指令可由计算设备执行以使得计算设备执行如上所述的方法。
根据本发明的又一个方面,提出了一种用构建图半监督学习模型的系统,包括:存储器;以及至少一个处理器,该至少一个处理器可操作地耦合到所述存储器并配置用于执行如上所述的方法。
根据本发明的再一个方面,提出了一种用于构建图半监督学习模型的计算机系统,所述系统包括分别用于执行如上所述的方法的各个步骤的模块。
附图说明
通过参照附图阅读下面对说明性实施例的详细说明可更好地理解发明本身以及其优选使用模式、目标、特征以及优点,在附图中:
图1示出了某医院同时利用有标注样本和无标注样本对检测报告进行分类的示例;
图2示出了利用k近邻构建图结构方法构建的一个图结构的示例;
图3示出了根据本发明的一个或多个实施例的一种用于构建图半监督学习模型的方法的流程图;
图4示出了根据本发明的一个或多个实施例的一种利用获得最大平均间隔来确该子图结构的最优k值的方法的流程图;
图5A、图5B、图5C示出了图4所示的方法的步骤410的一个示例的不同处理阶段;
图6示出了根据本发明的一个或多个实施例的一种利用候选图结构,获得一个特定k值对应的多个训练样本中各个训练样本的间隔的平均间隔的方法的流程图;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于清华大学;南京大学,未经清华大学;南京大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010428382.3/2.html,转载请声明来源钻瓜专利网。