[发明专利]模型获取方法、装置、电子设备及计算机可读存储介质有效
申请号: | 201810070429.6 | 申请日: | 2018-01-24 |
公开(公告)号: | CN108197664B | 公开(公告)日: | 2020-09-04 |
发明(设计)人: | 孙鹏飞;张昊 | 申请(专利权)人: | 北京墨丘科技有限公司 |
主分类号: | G06K9/62 | 分类号: | G06K9/62 |
代理公司: | 北京智信四方知识产权代理有限公司 11519 | 代理人: | 钟文芳 |
地址: | 100080 北京市海淀区*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 模型 获取 方法 装置 电子设备 计算机 可读 存储 介质 | ||
本公开实施例公开了模型获取方法、装置、电子设备及计算机可读存储介质。所述方法包括:获取用户标注数据;所述用户标注数据包括第一训练样本和用户对所述第一训练样本的第一标注结果;从预训练模型集中选取与所述用户标注数据相匹配的预训练模型;所述预训练模型集包括一个或多个预先经过机器学习训练的预训练模型。通过本公开的实施方式,用户可以仅根据少量的用户标注数据,快速得到一个经过大量数据训练的预训练模型,由于服务器选择了最接近用户需求的预训练模型,用户可以直接部署该预训练模型并容忍少量误差,或者通过再训练的方式快速达到自身的需求,节省了用户成本,提高了用户体验。
技术领域
本公开涉及智能识别技术领域,具体涉及一种模型获取方法、装置、电子设备及计算机可读存储介质。
背景技术
近年来人工智能技术得到了飞速发展并逐步应用到更多的行业和领域中,其中的原因是机器学习作为一个分支得到了突破性的进展。机器学习方法作为人工智能的一个分支,其能够通过训练数据的增加而不断提升人工智能任务的性能。也就是说,人工智能技术的发展来自于将任务建立在利用更多的数据的方法之上。例如,机器学习中的一个分支深度学习就能够通过不断使用更多的训练数据,得到传统人工智能方法无法达到的水平,进而使得过去只能停留在实验室的技术可以在工业和民用领域得到实际应用。
发明内容
本公开实施例提供一种模型获取方法、装置、电子设备及计算机可读存储介质。
第一方面,本公开实施例中提供了一种模型获取方法,所述方法运行在服务器,包括:
获取用户标注数据;其中,所述用户标注数据包括第一训练样本和用户对所述第一训练样本的第一标注结果;
从预训练模型集中选取与所述用户标注数据相匹配的预训练模型;所述预训练模型集包括一个或多个预先经过机器学习训练的预训练模型。
可选地,从预训练模型集中选取与所述用户标注数据相匹配的预训练模型,包括:
根据所述用户标注数据识别所述用户对所述第一训练样本的用户标注标准;
从所述预训练模型集中选取与所述用户标注标准相匹配的所述预训练模型。
可选地,从预训练模型集中选取与所述用户标注数据相匹配的预训练模型,包括:
将所述第一训练样本输入到至少一个所述预训练模型中;
将至少一个所述预训练模型的输出结果与所述第一标注结果进行匹配;
根据匹配结果选取与所述第一标注结果的匹配度最高的所述预训练模型。
可选地,将至少一个所述预训练模型的输出结果与所述第一标注结果进行匹配,包括:
匹配所述第一标注结果所属第一种类的个数以及所述预训练模型的输出种类个数;所述第一种类的个数根据所述用户标注数据中多个第一训练样本对应的多个第一标注结果的不同种类确定;以及
匹配所述第一种类以及所述预训练模型的输出种类。
可选地,匹配所述第一种类以及所述预训练模型的输出种类,包括:
根据所述第一标注结果属于第一种类的所述第一训练样本与所述输出结果为与所述第一种类对应的所述输出种类的所述第一训练样本计算所述第一种类与输出种类之间的误差。
可选地,根据所述第一标注结果属于第一种类的所述第一训练样本与所述输出结果为与所述第一种类对应的所述输出种类的所述第一训练样本计算所述第一种类与输出种类之间的误差,包括:
确定属于第一种类的所述第一训练样本与所述输出结果为与所述第一种类对应的所述输出种类的所述第一训练样本的交集;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京墨丘科技有限公司,未经北京墨丘科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201810070429.6/2.html,转载请声明来源钻瓜专利网。