[发明专利]一种基于注意力机制的卷积时序房价预测方法在审
申请号: | 202110250804.7 | 申请日: | 2021-03-08 |
公开(公告)号: | CN112819256A | 公开(公告)日: | 2021-05-18 |
发明(设计)人: | 刘歆;钟明;姜美兰 | 申请(专利权)人: | 重庆邮电大学 |
主分类号: | G06Q10/04 | 分类号: | G06Q10/04;G06Q30/02;G06Q50/16;G06N3/04;G06N3/08 |
代理公司: | 北京同恒源知识产权代理有限公司 11275 | 代理人: | 赵荣之 |
地址: | 400065 *** | 国省代码: | 重庆;50 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 注意力 机制 卷积 时序 房价 预测 方法 | ||
本发明涉及一种基于注意力机制的卷积时序房价预测方法,属于计算机领域。首先对房价数据集进行预处理并得到由房屋价格相关多维因素按时间构成的序列。考虑到影响房子价格有多维相关因素,对房屋价格趋势的波动和影响,使基于注意力机制的用卷积时序神经网络来对房价进行预测,其中采用了一维卷积神经网络对多维相关因素的特征进行处理,得到进一步特征提取和降维后的多维特征向量,再将特征向量输入到长短期记忆模型中学习特征之间的长期整体趋势和短期局部依赖信息。本发明结合了房价时序预测在长期整体趋势和短期局部的信息,降低了房价预测的方差,提高了多维时序数据房价预测方法的泛化能力。
技术领域
本发明属于计算机领域,涉及一种基于注意力机制的卷积时序房价预测方法。
背景技术
目前,房价数据集来源于房价网站中,而这些数据一般不易获取,需要通过个人进行收集得到,数据集的质量受到多种因素影响。例如,收集到的真实数据集可能包含的特征数量少,缺失率大,包含的信息量少,而现有的房价预测方法不能从有限的数据集中发现更多有用时序信息。因此,在有限的数据集中设计一种能够从时间序列上有效提取房子时序信息并进行预测的方法非常有必要。
现有的主流房价预测方法多考虑房子的特征和房价之间的关系。如有研究者使用机器学习模型,如随机森林回归,通过集成学习的思想将多颗决策树集成的一种算法,它的基本单元是决策树,在实际的房价预测中通过决策树对房价特征的判断分支来对房价预测。随机森林回归在实际预测中受到决策树颗数的影响,能处理很高维度的数据,并且无需做特征选择。而在时序预测方面常用的ARIMA模型从一维的房价数据进行预测,能够从整体的趋势上预测房价。
但是,以上方法还存在以下的问题:
(1)一些机器学习方法如随机森林等模型没有考虑到时间维度上房价的变化情况,而且基于多个决策数的集成模型可能出现过拟合的情况,即在训练集上预测结果表现很好,而在测试集上预测效果表现很差。
(2)一些时序预测模型如ARIMA只能从房价这一个维度考虑房价的未来的趋势,随着时间的发展,这些时序预测模型的累计误差越来越大,且只能对房价长期的整体趋势进行预测,局部价格的变化并不能很好的拟合,从而导致预测精度降低。因此,本发明提出一种基于注意力机制的卷积时序房价预测方法。
发明内容
有鉴于此,本发明的目的在于提供一种基于注意力机制的卷积时序房价预测方法。整个模型考虑从房子的多维时序特征对房价进行预测,它使用了一维卷积神经网络来自动提取时序特征局部信息得到特征向量,并将特征向量送入长短记忆网络中学习时序特征长期与短期局部依赖的信息。本研究在卷积时序预测模型中引入了注意力机制来特别关注房价时序预测的中时间步的权重,注意力机制层通过将时间步长和输入特征进行对换,使用全连接层计算每个时间步长的权重,将得到的权重与之前输入每个时间步长的特征进行相乘,因此赋予了每个时间步长权重,最后再通过全连接层获得房价的预测结果。
为达到上述目的,本发明提供如下技术方案:
一种基于注意力机制的卷积时序房价预测方法,该方法包括以下步骤:
S1:房价数据集预处理;
S2:训练基于注意力机制的卷积时序房价预测模型,并得到预测结果。
可选的,所述S1具体步骤如下:
S11:对已有的房价数据集进行分析,房价数据集中的特征包括经纬度、房间个数、附近有无地铁、装修条件和建筑类型;所述特征和单价的关联度通过皮尔森相关系数与先验知识进行特征筛选;
S12:通过Python相关的第三方Pandas库对筛选后的特征进行分析,查看每个特征的缺失率,对于缺失率大于50%的特征进行直接删除,对于缺失率低于50%特征进行平均值填充;
S13:根据箱型图和散点图判断特征是否有离群点,若有则进行删除;离群点表示异常值;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于重庆邮电大学,未经重庆邮电大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110250804.7/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种溶磷真菌及其应用
- 下一篇:一种广告出价方法和系统
- 同类专利
- 专利分类
G06Q 专门适用于行政、商业、金融、管理、监督或预测目的的数据处理系统或方法;其他类目不包含的专门适用于行政、商业、金融、管理、监督或预测目的的处理系统或方法
G06Q10-00 行政;管理
G06Q10-02 .预定,例如用于门票、服务或事件的
G06Q10-04 .预测或优化,例如线性规划、“旅行商问题”或“下料问题”
G06Q10-06 .资源、工作流、人员或项目管理,例如组织、规划、调度或分配时间、人员或机器资源;企业规划;组织模型
G06Q10-08 .物流,例如仓储、装货、配送或运输;存货或库存管理,例如订货、采购或平衡订单
G06Q10-10 .办公自动化,例如电子邮件或群件的计算机辅助管理