[发明专利]基于边缘节点处的数据输入对机器学习模型排序和更新在审

专利信息
申请号: 201910565265.9 申请日: 2019-06-27
公开(公告)号: CN110659740A 公开(公告)日: 2020-01-07
发明(设计)人: R·K·甘蒂;M·斯里瓦萨;S·莱拉帕里;S·斯里兰加姆斯里德哈拉 申请(专利权)人: 国际商业机器公司
主分类号: G06N20/00 分类号: G06N20/00
代理公司: 11247 北京市中咨律师事务所 代理人: 刘薇;于静
地址: 美国*** 国省代码: 美国;US
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 机器学习模型 输入数据集 哈希函数 排序 计算输入数据 训练数据集 计算距离 计算训练 训练过程 训练机器 输入数 数据集 处理器 学习
【说明书】:

由处理器接收用于训练新的机器学习模型的输入数据集。对于多个被训练的机器学习模型中的每一个,取得哈希函数和用于训练机器学习模型的训练数据集的草图。基于哈希函数和输入数据集计算输入数据集的草图,并计算训练数据集的草图与输入数据集的草图之间的距离。被训练的机器学习模型的计算距离从最小到最大进行排序,并且至少部分地基于该排序,从被训练的机器学习模型中选择用于输入数集的种子机器学习模型。启动使用所选择的种子机器学习模型和输入数据集的新的机器学习模型的训练过程。

关于联邦政府资助的研究或开发的声明

发明是在陆军研究办公室(AR)授予的W911NF-16-3-0001的政府支持下完成的。政府对本发明享有一定的权利。

技术领域

本发明一般涉及计算机系统,并且更具体地,涉及用于基于在分布式计算机系统中的边缘节点处的数据输入来对机器学习模型进行排序和更新的系统和方法。

背景技术

机器学习是通常使用统计技术以通过向计算机馈送采用观察和现实世界交互的形式的数据和信息来给予计算机以自主方式随时间学习或逐步改进特定任务的性能的能力的人工智能的子集。机器学习模型可以根据在分布式计算机系统的边缘节点处收集的数据来构建,以实现对当前和未来事件的检测、分类和预测。深度学习是基于学习数据表示的更广泛的机器学习方法系列的一部分,而不是特定于任务的算法。深度学习模型需要大量标记的训练数据集。

通常,训练作为深度学习模型的机器学习模型的第一步是识别种子模型(例如,先前训练的机器学习模型),其可被重新训练以更好地适合新的输入数据集和/或应用。识别这种种子模型的现有方法包括试错法,该方法既麻烦又是手动的,并且可能不会导致选择与其他潜在种子模型相比需要最少量训练的种子模型。

用于机器学习的常见范例是机器学习模型在云中(例如,在云节点上)训练,并且被训练的机器学习模型应用或用于在分布式计算机系统的边缘节点处对实时数据进行评分。该方法的主要缺点是不能跟踪在应用了训练模型的边缘节点处看到的输入的变化,因此,该方法无法支持持续学习和对先前训练的机器学习模型的更新。

因此,虽然机器学习技术适合于预期目的,但是,需要一种具有本发明的实施例的某些特征的系统或方法。

发明内容

根据本发明的一个或多个实施例,提供了用于基于在分布式计算机系统中的边缘节点处的数据输入来对机器学习模型进行排序和更新的计算机实现的方法。非限制性示例计算机实现的方法包括由处理器接收用于训练新的机器学习模型的输入数据集。对于多个被训练的机器学习模型中的每一个,取得哈希函数和用于训练机器学习模型的训练数据集的草图(sketch)。基于哈希函数和输入数据集来计算输入数据集的草图,并计算训练数据集的草图与输入数据集的草图之间的距离。对多个被训练的机器学习模型从最小计算距离到最大计算距离进行排序。至少部分地基于该排序,从多个被训练的机器学习模型中选择种子机器学习模型。至少部分地基于该选择,启动新的机器学习模型的训练过程。训练过程至少部分地基于所选择的种子机器学习模型和输入数据集。

除了上文或下文描述的一个或多个特征之外,或者作为替代,计算机实现的方法的其他实施例可以包括:选择被排序为具有最小计算距离的被训练的机器学习模型作为种子机器学习模型。使用种子模型的技术益处和优点可包括训练新的机器学习模型所需的较少的中央处理单元(CPU)资源。使用种子模型的附加技术益处和优点可以包括由于生成新的机器学习模型所需的较少量的训练数据而需要的较少的存储容量和较少的网络/总线带宽。

除了上文或下文描述的一个或多个特征之外,或作为替代,计算机实现的方法的其他实施例可以包括:响应于接收,由节点自动执行上述执行、排序、选择和启动。技术优势和优点可以包括不需要用户输入来生成新的机器学习模型。这可以节省CPU和网络资源两者。

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于国际商业机器公司,未经国际商业机器公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/201910565265.9/2.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top