[发明专利]通过DNA计算进行机器学习(ML)建模在审

专利信息
申请号: 201980033644.1 申请日: 2019-05-24
公开(公告)号: CN112136144A 公开(公告)日: 2020-12-25
发明(设计)人: G.F.迪亚曼蒂;A.鲍格曼;M.马佐拉蒂 申请(专利权)人: 国际商业机器公司
主分类号: G06N5/00 分类号: G06N5/00
代理公司: 北京市柳沈律师事务所 11105 代理人: 邸万奎
地址: 美国纽*** 国省代码: 暂无信息
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 通过 dna 计算 进行 机器 学习 ml 建模
【说明书】:

介绍了方法、计算机程序产品和系统。所述方法包括例如:识别训练数据集合并为初始β值定义一个窗口,该窗口表示在对来自训练数据集合的每个特征向量形成条件的期望中可以容忍的偏差。通过使用DNA计算机并行调整条件期望值。在候选模型的众多组合中,产生了最合适的集成作为机器学习模型,用于基于除训练数据集合以外的输入来预测目标结果。

技术领域

本公开涉及机器学习技术,并且更具体地涉及用于生成由DNA计算并行正则化的机器学习模型的方法、计算机程序产品和系统。

背景技术

在传统的机器学习(ML)技术中,经常对训练数据进行正则化,以解决ML模型对训练数据的过度拟合问题,从而使ML模型对不同于训练数据的输入数据有用。然而,训练数据的这种正则化是计算密集的过程。同样,由于当今可用的许多正则化方法在正则化ML模型方面提供了明显的好处,因此众所周知,高度正则化的训练数据对于使ML模型健壮可靠以用于各种输入数据是必不可少的。

发明内容

通过一方面提供一种方法,克服了现有技术的缺点,并提供了其他优点。用于生成机器学习模型的方法包括,例如:由两个或多个处理器识别训练数据集合;由所述两个或者多个处理器为初始β值定义窗口,其中所述初始β值表示在各个条件期望中所述识别的训练数据集的偏差;由所述两个或者多个处理器对与来自所述训练数据集合的每个特征向量相对应的所述各个条件期望进行正则化,其中,对每个特征向量并行执行两种或更多种对所述条件期望正则化的方法;由所述两个或多个处理器从正则化产生的所述条件期望中创建多个模型集成;以及由所述两个或多个处理器在所述创建的集成中生成最合适的集成作为所述机器学习模型,其中所述机器学习模型基于所述训练数据集合的不同输入来预测目标结果,其中所述两个或多个处理器包括一个或多个数字处理器和一个或多个DNA处理器。

从第一方面来看,本发明提供了一种用于生成机器学习模型的计算机实现的方法,该方法包括:由两个或多个处理器识别训练数据集合;由所述两个或者多个处理器为初始β值定义窗口,其中所述初始β值表示在各个条件期望中所述识别的训练数据集的偏差;由所述两个或者多个处理器对与来自所述训练数据集合的每个特征向量相对应的所述各个条件期望进行正则化,其中,对每个特征向量并行执行两种或更多种对所述条件期望正则化的方法;由所述两个或多个处理器从正则化产生的所述条件期望中创建多个模型集成;以及由所述两个或多个处理器在所述创建的集成中生成最合适的集成作为所述机器学习模型,其中所述机器学习模型基于所述训练数据集合的不同输入来预测目标结果,其中所述两个或多个处理器包括一个或多个数字处理器和一个或多个DNA处理器。

优选地,本发明提供一种计算机实现的方法,其中所述正则化包括:由所述一个或多个数字处理器,将正则化度量加到各自的条件期望中,其中表示残差平方和,是根据正则化方法得出的正则化幅度的等级

优选地,本发明提供一种计算机实现的方法,用于所述正则化的所述正则化方法是最小绝对收缩和选择算子LASSO,并且其中

优选地,本发明提供一种计算机实现的方法,其中用于所述正则化的正则化方法是Ridge回归(RR),并且其中,

优选地,本发明提供一种计算机实现的方法,该方法还包括:由所述一个或多个DNA处理器将来自所述正则化的条件期望编码为相应的DNA链,其中所述编码和所述正则化在所述相应的DNA链上彼此相互作用。

优选地,本发明提供了一种计算机实现的编码方法,包括:由所述一个或多个DNA处理器基于所述定义的窗口中相应的β值扩增核苷酸;将所述扩增的核苷酸编码为各自的核碱基;将所述编码的核碱基添加到当前的DNA链上;以及将来自所述正则化的DNA链串联到来自所述添加的当前DNA链。

优选地,本发明提供了一种计算机实现的方法,该方法还包括:通过改变所述各个条件期望中的β值,由所述两个或者多个处理器将外部影响包括进所述正则化的条件期望,其中所述改变的β值增加或减小各个外部影响的权重。

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于国际商业机器公司,未经国际商业机器公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/201980033644.1/2.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top