[发明专利]模型训练方法及装置、电子设备和介质有效
申请号: | 202110925544.9 | 申请日: | 2021-08-12 |
公开(公告)号: | CN113642635B | 公开(公告)日: | 2023-09-15 |
发明(设计)人: | 马小龙 | 申请(专利权)人: | 百度在线网络技术(北京)有限公司 |
主分类号: | G06F18/241 | 分类号: | G06F18/241;G06F18/214 |
代理公司: | 北京市汉坤律师事务所 11602 | 代理人: | 姜浩然;吴丽丽 |
地址: | 100085 北京市*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 模型 训练 方法 装置 电子设备 介质 | ||
本公开提供了一种模型训练方法、装置、电子设备、计算机可读存储介质和计算机程序产品,涉及计算机领域,尤其涉及深度学习技术领域。实现方案为:获取离散化的多个待变换的样本标签值;确定对待变换的样本标签值进行数据变换的约束条件;通过参数寻优方法确定满足约束条件的变换后的样本标签值集合,变换后的样本标签值集合中的样本标签值与该多个待变换的样本标签值一一对应;以及基于变换后的样本标签值集合对模型进行训练。
技术领域
本公开涉及计算机领域,尤其涉及深度学习技术领域,具体涉及一种模型训练方法、装置、电子设备、计算机可读存储介质和计算机程序产品。
背景技术
人工智能是研究使计算机来模拟人的某些思维过程和智能行为(如学习、推理、思考、规划等)的学科,既有硬件层面的技术也有软件层面的技术。人工智能硬件技术一般包括如传感器、专用人工智能芯片、云计算、分布式存储、大数据处理等技术:人工智能软件技术主要包括计算机视觉技术、语音识别技术、自然语言处理技术以及机器学习/深度学习、大数据处理技术、知识图谱技术等几大方向。
随着人工智能的发展,机器学习模型应用的范围越来越广泛。不同的场景有不同的样本标签,在基于机器学习进行模型训练之前,通常需要对样本标签进行处理变换。常见的变换方式是依据人工经验设计变换策略,比如归一化或者取对数运算等等。而人工设定的样本标签变换策略,对于特定的学习任务不一定适合,影响机器学习的效果。
发明内容
本公开提供了一种模型训练方法、装置、电子设备、计算机可读存储介质和计算机程序产品。
根据本公开的一方面,提供了一种模型训练方法,包括:获取离散化的多个待变换的样本标签值;确定对所述待变换的样本标签值进行数据变换的约束条件;通过参数寻优方法确定满足所述约束条件的变换后的样本标签值集合,所述变换后的样本标签值集合中的样本标签值与所述多个待变换的样本标签值一一对应;以及基于所述变换后的样本标签值集合对所述模型进行训练。
根据本公开的另一方面,提供了一种信息推荐方法,包括:基于本公开的一方面所述的方法所训练得到的模型获取预测的用户对于待推荐信息的交互行为数据;以及基于所述交互行为数据对所述待推荐信息进行推荐,其中,所述交互行为数据包括以下项所组成的组中的至少一个:点击率、停留时长。
根据本公开的另一方面,提供了一种模型训练装置,包括:获取单元,配置为获取离散化的多个待变换的样本标签值;第一确定单元,配置为确定对所述待变换的样本标签值进行数据变换的约束条件;第二确定单元,配置为通过参数寻优方法确定满足所述约束条件的变换后的样本标签值集合,所述变换后的样本标签值集合中的样本标签值与所述多个待变换的样本标签值一一对应;以及训练单元,配置为基于所述变换后的样本标签值集合对所述模型进行训练。
根据本公开的另一方面,提供了一种信息推荐装置,包括:获取单元,配置为基于本公开的一方面所述的方法所训练得到的模型获取预测的用户对于待推荐信息的交互行为数据;以及推荐单元,配置为基于所述交互行为数据对所述待推荐信息进行推荐,其中,所述交互行为数据包括以下项所组成的组中的至少一个:点击率、停留时长。
根据本公开的另一方面,提供了一种电子设备,包括:至少一个处理器;以及与至少一个处理器通信连接的存储器;存储器存储有可被至少一个处理器执行的指令,该指令被至少一个处理器执行,以使至少一个处理器能够执行根据本公开所述的方法。
根据本公开的另一方面,提供了一种存储有计算机指令的非瞬时计算机可读存储介质,该计算机指令用于使计算机执行根据本公开所述的方法。
根据本公开的另一方面,提供了一种计算机程序产品,包括计算机程序,该计算机程序在被处理器执行时实现根据本公开所述的方法。
根据本公开的一个或多个实施例,不需要依赖专家经验确定样本标签的变换策略,通过参数寻优方法可以自适应获取更适合给定的学习任务的变换后的样本标签值,可以显著提升模型的迭代效果。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于百度在线网络技术(北京)有限公司,未经百度在线网络技术(北京)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110925544.9/2.html,转载请声明来源钻瓜专利网。
- 上一篇:审计项存储方法、装置以及系统
- 下一篇:一种市政工程用自锁式防盗井盖