[发明专利]基于机器学习的预测分类方法、装置和计算机设备在审
申请号: | 202010281340.1 | 申请日: | 2020-04-10 |
公开(公告)号: | CN111522862A | 公开(公告)日: | 2020-08-11 |
发明(设计)人: | 唐永鹏;刘硕凌;程宁;韩雷 | 申请(专利权)人: | 易方达基金管理有限公司 |
主分类号: | G06F16/2458 | 分类号: | G06F16/2458;G06Q40/04;G06N20/00 |
代理公司: | 北京英特普罗知识产权代理有限公司 11015 | 代理人: | 程超 |
地址: | 519000 广东省珠海市横琴新*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 机器 学习 预测 分类 方法 装置 计算机 设备 | ||
本发明提供了一种基于机器学习的预测分类方法、装置和计算机设备。该方法包括:获取经济数据集;确定每条经济数据对应的分类结果;根据经济数据集和每条经济数据对应的分类结果构建P个第一数据集,其中,第一数据集包括若干条经济数据和对应的分类结果,且第一数据集中的经济数据在时间上不延续;根据经济数据构建输入特征,将经济数据对应的分类结果作为输出,针对每个第一数据集构建初始机器学习模型,并进行W折交叉验证;在W*P个训练好的机器学习模型中按照预设要求选择若干最终模型;根据待预测经济数据构建待预测输入特征,并将待预测输入特征输入至最终模型,以得到预测分类结果。通过本发明,能够提升预测分类的准确性。
技术领域
本发明涉及机器学习技术领域,尤其涉及一种基于机器学习的预测分类方法、装置和计算机设备。
背景技术
随着机器学习、大数据等技术的发展,通过现实历史数据的特征预测未来指标结果的应用越来越广泛,其中,通常需要先利用部分数据,也即训练数据进行机器学习得到训练好的学习模型,然后再用另一部分数据,也即测试数据进行测试,当训练好的学习模型在测试数据中满足预测准确性要求时,在对待预测的数据进行预测,从而进一步能够基于预测结果来指导实际生成生活,具体地,在现有技术中,通常基于时间进行测试数据和训练数据的切分,设定一个时间点之前的数据为训练数据,之后的数据为测试数据。
但是,发明人研究发现,当现实历史数据为经济数据时,基于经济数据本身在时间上具备延续性,样本前后相关性较强,通过时间点直接切分训练数据和测试数据的方式,无论测试样本还是训练样本之间,均具有较强的相关性,导致训练好的学习模型的泛化能力弱,在对待预测的数据进行预测时并不能得到很好的预测结果。
因此,提供一种基于机器学习的预测分类方法、装置和计算机设备,进一步提升在经济学领域基于机器学习的预测分类方法的准确性,成为本领域亟需解决的技术问题。
发明内容
本发明的目的是提供一种基于机器学习的预测分类方法、装置和计算机设备,用于解决现有技术中的上述技术问题。
一方面,为实现上述目的,本发明提供了一种基于机器学习的预测分类方法。
该基于机器学习的预测分类方法包括:获取经济数据集,其中,经济数据集包括在时间上延续N条经济数据,每条经济数据包括M个经济特征,其中,N和M均为自然数;确定每条经济数据对应的分类结果,其中,分类结果包括第一结果和第二结果;根据经济数据集和每条经济数据对应的分类结果构建P个第一数据集,其中,第一数据集包括若干条经济数据和对应的分类结果,且第一数据集中的经济数据在时间上不延续,P为自然数;根据经济数据构建输入特征,将经济数据对应的分类结果作为输出,针对每个第一数据集构建初始机器学习模型,并进行W折交叉验证,得到W*P个训练好的机器学习模型;在W*P个训练好的机器学习模型中按照预设要求选择若干最终模型;根据待预测经济数据构建待预测输入特征,并将待预测输入特征输入至最终模型,以得到预测分类结果。
进一步地,采用以下方法构建P个第一数据集:以P为间隔将经济数据集进行分割,得到Q个数据集单元,其中,P*Q小于或等于N;将各个数据集单元中相同位置的经济数据及其对应的分类结果划分为同一数据集,以得到第一数据集。
进一步地,根据经济数据构建输入特征的步骤包括:获取第一数据集中的第一经济数据,其中,第一经济数据为第一数据集中的任意一条经济数据,第一经济数据包括第1至第n经济特征;确定时间区间集合{t1,t2,...tm};在经济数据集中获取第x经济特征之前且与第x经济特征属于同类的ty个经济特征的平均值,作为第x经济特征对应的第y维特征,其中,x=1,2,...,n,y=1,2,...,m;将第一经济数据中的每个经济特征对应的m维特征作为输入特征。
进一步地,在W*P个训练好的机器学习模型中按照预设要求选择若干最终模型的步骤包括:获取W*P个训练好的机器学习模型中AUC大于60%的机器学习模型作为最终模型。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于易方达基金管理有限公司,未经易方达基金管理有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010281340.1/2.html,转载请声明来源钻瓜专利网。