[发明专利]选择学习模型的系统及选择学习模型的方法在审
申请号: | 202110900758.0 | 申请日: | 2021-08-06 |
公开(公告)号: | CN114118194A | 公开(公告)日: | 2022-03-01 |
发明(设计)人: | C·利马桑切斯;野中雄一;金丸隆;小松佑人 | 申请(专利权)人: | 株式会社日立制作所 |
主分类号: | G06K9/62 | 分类号: | G06K9/62;G06N3/04;G06N3/08 |
代理公司: | 永新专利商标代理有限公司 72002 | 代理人: | 高迪 |
地址: | 日本*** | 国省代码: | 暂无信息 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 选择 学习 模型 系统 方法 | ||
课题在于,提供选择学习模型的系统及选择学习模型的方法,从训练完成的学习模型中选择利用于新任务的适合的学习模型。解决手段在于,存储装置存放多个现有学习模型各自的关联信息。处理器取得关于新任务的内容的信息,从用于新任务的新训练数据集提取新特征量矢量。处理器参照关联信息,取得关于多个现有模型各自的任务的内容的信息、以及多个现有模型各自的训练数据的特征量矢量。处理器基于关于新任务的内容的信息与关于多个现有模型各自的任务的信息之间的比较结果、以及新特征量矢量与多个现有模型各自的特征量矢量之间的比较结果,从多个现有模型选择用于新任务的候选学习模型。
技术领域
本发明涉及选择学习模型的系统。
背景技术
对进行“长尾业务活动”(虽然有大量顾客,但关于各顾客只能利用极少的数据的业务活动)的企业而言,将以前开发的深度学习模型用于新的顾客是有益的。例如,专利文献1公开生成深度学习网络模型的方法。该方法从用户的多模式输入中提取与深度学习网络的生成相关联的1个以上的项目,基于该项目对源于深度学习网络模型的详情进行估计。该方法制作基于深度学习网络模型的中间表现,该中间表现包含与深度学习网络模型相关联的1个以上的数据项目、以及源于深度学习网络模型的1个以上的设计详情。该方法将中间表现自动地转换为源码。
在先技术文献
专利文献
专利文献1:美国专利申请公开第2018/0307978号
发明内容
发明所要解决的课题
但是,基于以下几个理由,难以将以前开发的深度学习模型用于新的顾客。这些理由有顾客的数据集间的域间隙(domain gap)、深度学习框架的差异、任务的差异等。进而,难以对一个顾客的数据集进行评价,并利用追加数据进行补充。因此,此前的途径是充分收集新的顾客的数据,或者利用极少量的数据从最初开始构筑新的模型。前者存在学习的实施相应地延迟的问题,后者存在性能有可能无法达到充分好的问题。另外,在使用以前构筑的模型的情况下,为了理解其安装需要付出很大努力。
用于解决课题的手段
本发明的一个方式是选择针对用户任务的学习模型的系统,包含1个以上的处理器和1个以上的存储装置,所述1个以上的存储装置存放多个现有学习模型各自的关联信息,所述1个以上的处理器取得关于新任务的内容的信息,从用于所述新任务的新训练数据集提取新特征量矢量,参照所述关联信息,取得关于所述多个现有模型各自的任务的内容的信息、以及所述多个现有模型各自的训练数据的特征量矢量,基于关于所述新任务的内容的信息与关于所述多个现有模型各自的任务的信息之间的比较结果、以及所述新特征量矢量与所述多个现有模型各自的特征量矢量之间的比较结果,从所述多个现有模型选择用于所述新任务的候选学习模型。
发明效果
根据本发明的一个方式,能够从训练完成的学习模型中选择利用于新任务的恰当的学习模型。
附图说明
图1A示意性地表示本说明书的一个实施方式所涉及的模型生成系统的逻辑构成。
图1B表示本说明书的一个实施方式所涉及的模型生成系统的硬件构成例。
图2表示本说明书的一个实施方式所涉及的模型生成系统的整体动作例。
图3表示本说明书的一个实施方式所涉及的任务分析部、本质特征量提取部、数据库比较部以及模型选择部的处理例。
图4表示本说明书的一个实施方式所涉及的数据集评价部的处理例。
图5表示本说明书的一个实施方式所涉及的模型数据库中存放的数据的构成例。
图6示意性地表示用于学习模型选择的用户界面、以及用于该用户界面的数据的模型生成系统的处理的例子。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于株式会社日立制作所,未经株式会社日立制作所许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110900758.0/2.html,转载请声明来源钻瓜专利网。
- 上一篇:连接装置
- 下一篇:显示装置和驱动显示面板的方法