[发明专利]一种机器学习模型的编码解码方法与装置有效
申请号: | 201811293226.X | 申请日: | 2018-11-01 |
公开(公告)号: | CN109472366B | 公开(公告)日: | 2020-07-24 |
发明(设计)人: | 刘红丽;李峰;刘宏刚 | 申请(专利权)人: | 苏州浪潮智能科技有限公司 |
主分类号: | G06N20/00 | 分类号: | G06N20/00 |
代理公司: | 北京连和连知识产权代理有限公司 11278 | 代理人: | 刘小峰 |
地址: | 215100 江苏省苏州市吴*** | 国省代码: | 江苏;32 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 机器 学习 模型 编码 解码 方法 装置 | ||
本发明公开了一种机器学习模型的编码解码方法与装置,包括:采集原始数据并对原始数据进行抽样;使用模型生成器将原始数据编码为模型编码;使用模型解码器将模型编码的抽样结果解码为有效模型;使用原始数据训练有效模型。本发明的技术方案能够针对不同机器学习模型或不同类型的机器学习模型进行编码解码,降低计算复杂度,快速生成机器学习模型。
技术领域
本发明涉及机器学习领域,并且更具体地,特别是涉及一种机器学习模型的编码解码方法与装置。
背景技术
目前机器学习的应用并不广泛。首先,建模过程繁琐。算法建模及调参是一个非常繁琐的过程,需要数据预处理、特征工程、模型调参、模型评估等环节不断循环反复才能完成复杂的建模过程,一个3-6人的数据建模团队通常需要花费数月时间才能完成复杂的建模。其次,人工智能人才匮乏。机器学习涉及大量的工程和算法,依赖科学家的资源,然而目前中国人工智能的人才缺口超过500万,供求比例仅为1:10,并且人工智能专业人才普遍薪水较高,带来了巨大的人力成本。再次,算法设计周期长。一个互联网公司典型的人工智能项目开发需要30人·月,传统行业需要花费更多的人力和时间。最后,系统实施维护困难。生产环境不断发生变化,模型准确度下降,数据管理困难,算法模型更新周期长。
一种推广机器学习的方式是使用AutoML。AutoML使用了Google的learn2learn和转移学习等先进技术,帮助那些只有有限机器学习知识的企业构建高品质的自定义模型。AutoML也将使AI(人工智能)专家们更加高效地工作,拓展新的AI领域,并帮助那些技术娴熟的工程师构建强大的AI系统,这也是AI研究人员一直以来所追求的目标。将训练数据集传入后,AutoML会自动形成训练模型,这样即使不具备机器学习方面深入的专业知识也可以进行机器学习方面的工作。
由于AutoML的本质工作是将各个过程的方法进行选择、组合、优化,所以存在如下问题:我们通常并不知道所优化的参数和预期效果之间是什么样的显示表达,所以目标函数形式未知;可能的组合方式太多,所以搜索空间巨大;组合方式太多,而且每一个组合都需要从头做数据预处理、特征处理、模型训练等操作,所以函数计算代价巨大。
针对现有技术中的建立模型的计算复杂度过大,难以实现的问题,目前尚未有有效的解决方案。
发明内容
有鉴于此,本发明实施例的目的在于提出一种机器学习模型的编码解码方法与装置,能够针对不同机器学习模型或不同类型的机器学习模型进行编码解码,降低计算复杂度,快速生成机器学习模型。
基于上述目的,本发明实施例的一方面提供了一种机器学习模型的编码解码方法,包括以下步骤:
采集原始数据并对原始数据进行抽样;
使用模型生成器将原始数据的抽样结果编码为模型编码;
使用模型解码器将模型编码解码为有效模型;
使用原始数据训练有效模型。
在一些实施方式中,将模型编码解码为有效模型包括:
对模型编码使用cell结构搜索,生成第一编码结果;
根据原始数据对第一编码结果使用nasnet结构搜索,生成第二编码结果;
解码第二编码结果获得有效模型。
在一些实施方式中,第一编码结果和第二编码结果均为搜索空间矩阵。
在一些实施方式中,cell结构包括通常cell和规约cell,每个cell包括多个数据块,每个数据块各自包括约束条件信息、深度学习操作信息、和拼接操作信息。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于苏州浪潮智能科技有限公司,未经苏州浪潮智能科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201811293226.X/2.html,转载请声明来源钻瓜专利网。