[发明专利]算法选择方法、装置和电子设备在审
申请号: | 202110121910.5 | 申请日: | 2021-01-28 |
公开(公告)号: | CN112766402A | 公开(公告)日: | 2021-05-07 |
发明(设计)人: | 高志强 | 申请(专利权)人: | 维沃移动通信有限公司 |
主分类号: | G06K9/62 | 分类号: | G06K9/62;G06N3/04;G06N3/08 |
代理公司: | 北京润泽恒知识产权代理有限公司 11319 | 代理人: | 乔珊珊 |
地址: | 523863 广东*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 算法 选择 方法 装置 电子设备 | ||
本申请公开了一种算法选择方法、装置和电子设备。该方法包括:将目标样本数据划分为N份训练数据和M份测试数据;在j取1~G中的每一个整数时,执行如下过程:针对第j个备选算法,通过每一份训练数据分别进行训练,得到第j个备选算法的N个模型;根据M份测试数据,确定第j个备选算法的N个模型中的每一个模型的损失值;根据第j个备选算法的N个模型的损失值,确定第j个备选算法的目标参数;根据G个目标参数,从G个备选算法中确定目标算法;其中,G为备选算法的数量。因此,本申请实施例的方案,只需要根据目标样本数据确定备选算法的目标参数,从而根据目标参数就可以选出性能最优的算法,而不需要反复尝试与探索。
技术领域
本申请属于通信技术领域,具体涉及一种算法选择方法、装置和电子设备。
背景技术
机器学习是一个利用已有数据寻找一个能够刻画数据特征函数的过程。目前监督类机器学习分为回归学习及预测学习,在监督学习领域已经存在各种各样的学习算法,例如决策树、线性回归、贝叶斯分类、逻辑回归、支持向量机、极端梯度提升(xgboost)、神经网络族等。
其中,各类算法在进行机器学习任务时各有优劣,一般在遇到选择哪类算法进行工程应用的问题时,工程师往往是基于经验或者选择当前流行的机器学习算法。然后,利用所选择的机器学习算法以及已知数据集进行训练,并在训练过程中利用训练出来的标签和真实标签的差异(类似于偏差)来进行参数调优,从而选出最优的参数模型。
但是,在实现本申请过程中,发明人发现:由于各个应用场景特性不尽相同,如果最后模型效果评价不好,例如出现算法选择不合适或者利用选择的算法训练模型的成本较大且难以工程实现时,往往需要重新去尝试另外的算法,浪费了时间与成本。
由此可见,现有技术中,往往基于经验或者采用尝试的方式选择某一应用场景所使用的算法,其准确度较低,且探索成本较高。
本申请实施例的目的是提供一种算法选择方法、装置和电子设备,能够解决基于经验或者采用尝试的方式选择某一应用场景所使用的算法的准确度较低,且探索成本较高的问题。
为了解决上述技术问题,本申请是这样实现的:
第一方面,本申请实施例提供了一种算法选择方法,该方法包括:
将目标样本数据划分为N份训练数据和M份测试数据,其中,N大于1,M大于或等于1;
在j取1~G中的每一个整数时,执行如下过程:
针对第j个备选算法,通过每一份所述训练数据分别进行训练,得到第j个所述备选算法的N个模型;
根据所述M份测试数据,确定第j个所述备选算法的N个模型中的每一个模型的损失值;
根据第j个所述备选算法的N个模型的损失值,确定第j个所述备选算法的目标参数,其中,所述目标参数用于表示所述备选算法的性能优劣的评价值;
根据G个所述目标参数,从G个所述备选算法中确定目标算法;
其中,G为所述备选算法的数量。
第二方面,本申请实施例提供了一种算法选择装置,所述装置包括:
拆分模块,用于将目标样本数据划分为N份训练数据和M份测试数据,其中,N大于1,M大于或等于1;
第一参数确定模块,用于在j取1~G中的每一个整数时,执行如下过程:
针对第j个备选算法,通过每一份所述训练数据分别进行训练,得到第j个所述备选算法的N个模型;
根据所述M份测试数据,确定第j个所述备选算法的N个模型中的每一个模型的损失值;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于维沃移动通信有限公司,未经维沃移动通信有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110121910.5/2.html,转载请声明来源钻瓜专利网。