[发明专利]预测模型训练方法、价格预测方法、存储介质及电子设备在审
申请号: | 202010955586.2 | 申请日: | 2020-09-11 |
公开(公告)号: | CN112101566A | 公开(公告)日: | 2020-12-18 |
发明(设计)人: | 逄勃;王涛;齐彦伟;李德华;张永成 | 申请(专利权)人: | 石化盈科信息技术有限责任公司 |
主分类号: | G06N20/00 | 分类号: | G06N20/00;G06F16/951;G06F16/9535;G06Q30/02;G06Q50/06 |
代理公司: | 北京聿宏知识产权代理有限公司 11372 | 代理人: | 吴大建;陈敏 |
地址: | 100081 北京市海淀区*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 预测 模型 训练 方法 价格 存储 介质 电子设备 | ||
本发明公开了一种预测模型训练方法、价格预测方法、存储介质及电子设备,通过获取影响目标产品的产品价格的多个影响因素,及该目标产品在多个时刻下的产品价格,从预设网站的网址中获取各所述影响因素在每个所述时刻下分别对应的因素数据,对各时刻的产品价格及各所述影响因素在每个所述时刻下分别对应的因素数据采用预设算法进行训练以得到价格预测模型,以实现采用所述价格预测模型预测产品的价格,避免了现有技术中存在的价格预测不准确,且预测效率低下的问题。
技术领域
本发明属于价格预测技术领域,具体涉及一种预测模型训练方法、价格预测方法、存储介质及电子设备。
背景技术
随着信息技术尤其是互联网技术的发展,目前一些综合金融信息网站上已经积累了大量的数据资源,其涵盖了各种不同行业的数据,以石化行业为例,综合金融信息网站上涵盖与石化产品相关的原油价格、美国EIA库存、美元指数等宏观经济数据,以及国内化工品产能、开工率、需求量、下游产品消费量等供需相关数据。
金融行业通常通过分析上述的信息来分析石油行业的价格走向,以调整生产产品时的开工率从而达到合理投入人工的目的,但是现有技术中,通常存在价格走向预测不准确,且效率低下的问题。
发明内容
本发明克服了现有技术的不足之一提供了一种预测模型训练方法、价格预测方法、存储介质及电子设备。
第一方面,本发明提供一种预测模型训练方法,包括获取影响目标产品的产品价格的多个影响因素,及该目标产品在多个时刻下的产品价格;
从预设网站的网址中获取各所述影响因素在每个所述时刻下分别对应的因素数据;
对各时刻的产品价格及各所述影响因素在每个所述时刻下分别对应的因素数据采用预设算法进行训练以得到价格预测模型。
可选的,在上述预测模型训练方法中,对各时刻的产品价格及对应的处理后的因素数据采用预设算法进行训练以得到价格预测模型,包括:
将每个时刻的产品价格和该时刻处理后的因素数据作为与该时刻对应的样本数据;
将多个所述样本数据划分至训练样本集和验证样本集中,其中,所述训练样本集和验证样本集中分别包括多个样本数据;
将所述训练样本集中的多个样本数据采用多种预设算法分别进行训练以得到多个初始模型;
根据所述验证样本集中的多个样本数据对多个所述初始模型分别进行性能验证,以得到各所述初始模型的验证性能指标;
根据各所述初始模型的验证性能指标从多个初始模型中确定价格预测模型。
可选的,在上述预测模型训练方法中,所述多种预设算法包括Xgboost算法、GBRT算法以及LSTM算法中的至少两种。
可选的,在上述预测模型训练方法中,从预设网站的网址中获取各所述影响因素在每个所述时刻下分别对应的因素数据,包括:
获取具有所述影响因素的多个爬取网址,并将各所述爬取网址分别作为预设网站的网址;
基于所述影响因素和多个所述预设网址生成爬虫程序,并利用所述爬虫程序爬取所述预设网址以得到各所述影响因素分别对应的爬取数据;
对每个所述影响因素对应的爬取数据分别进行处理,以得到各所述影响因素在每个所述时刻下分别对应的因素数据。
可选的,在上述预测模型训练方法中,所述爬虫程序中包括爬虫任务,利用所述爬虫程序爬取所述预设网址以得到各所述影响因素分别对应的爬取数据,包括:
将所述爬虫任务拆分成多个子任务,且每个所述子任务对应一个所述预设网址;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于石化盈科信息技术有限责任公司,未经石化盈科信息技术有限责任公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010955586.2/2.html,转载请声明来源钻瓜专利网。