[发明专利]一种融合序列模式挖掘和代价敏感学习的空气质量等级预测方法在审
申请号: | 201710982410.4 | 申请日: | 2017-10-20 |
公开(公告)号: | CN107748932A | 公开(公告)日: | 2018-03-02 |
发明(设计)人: | 吕明琪;陈岭;李一帆;张圣;陈铁明 | 申请(专利权)人: | 杭州尚青科技有限公司 |
主分类号: | G06Q10/04 | 分类号: | G06Q10/04;G06N99/00 |
代理公司: | 杭州之江专利事务所(普通合伙)33216 | 代理人: | 张慧英 |
地址: | 310053 浙江省*** | 国省代码: | 浙江;33 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 融合 序列 模式 挖掘 代价 敏感 学习 空气质量 等级 预测 方法 | ||
1.一种融合序列模式挖掘和代价敏感学习的空气质量等级预测方法,其特征在于,包括如下步骤:
(1)从空气质量等级历史序列数据中挖掘序列模式,构造序列模式树;
(2)利用空气质量数据和气象历史数据构建训练样本集并抽取特征,基于代价敏感学习算法训练代价敏感预测模型;
(3)基于训练样本集,预测融合序列模式树和代价敏感预测模型,完成空气质量等级预测。
2.根据权利要求1所述的一种融合序列模式挖掘和代价敏感学习的空气质量等级预测方法,其特征在于:所述步骤(1)得到序列模式树的方法如下:
(1.1)从空气质量等级历史序列数据AS中找出所有频繁空气质量等级,并基于AS对每个频繁空气质量等级a1生成投影数据,将所有生成的投影数据合并构成初始投影数据库PS;
(1.2)以当前投影数据库PS为输入,对其中每个投影数据P,从P的子序列集SSP中找出所有频繁空气质量等级,并基于P对每个频繁空气质量等级a2生成投影数据,将所有生成的投影数据合并构成投影数据库PSP;
(1.3)判断当前投影数据库PSP是否为空,若不为空则返回执行步骤(1.2);否则进入步骤(1.4);
(1.4)对每个投影数据P生成一个序列模式,将生成的所有序列模式构成序列模式集;
(1.5)将序列模式集中的每个序列模式作为一个分支进行插入操作,构造得到序列模式树TM。
3.根据权利要求2所述的一种融合序列模式挖掘和代价敏感学习的空气质量等级预测方法,其特征在于:所述的频繁空气质量等级为出现次数大于阈值δ的空气质量等级,其中,阈值δ是预设的。
4.根据权利要求所2述的一种融合序列模式挖掘和代价敏感学习的空气质量等级预测方法,其特征在于:所述基于AS对a1生成投影数据的方法如下:
(I)搜索a1在AS中的所有出现位置,并对每个出现位置i,截取AS中位置从i+1开始到末尾的部分形成子序列;
(II)将a1作为前缀,结合生成的子序列集构成一个投影数据P;其中,其前缀记为PRP,其子序列集记为SSP。
5.根据权利要求所4述的一种融合序列模式挖掘和代价敏感学习的空气质量等级预测方法,其特征在于:所述基于P对a2生成投影数据的方法如下:
(i)将a2附加到P的前缀PRP后面形成新的前缀NPR;
(ii)对SSP中每个子序列SP,若SP中的第一个空气质量等级等于a2,则截取SP中位置从2开始到末尾的部分形成新的子序列;
(iii)将NPR作为前缀和生成的新的子序列集构成一个投影数据。
6.根据权利要求所2述的一种融合序列模式挖掘和代价敏感学习的空气质量等级预测方法,其特征在于:所述的序列模式树中每个节点对应一个空气质量等级和一个支持度,其中,对序列模式M进行插入操作的方法为:采用深度搜索算法在当前序列模式树中进行查找,若不存在任何分支与M匹配,则将M作为子节点序列插入序列模式树根节点,其中每个子节点的支持度均为M的支持度;若存在分支与M部分匹配,则将M中未匹配的部分作为子节点序列插入序列模式树中匹配到的最低层节点,同时更新模式树中匹配部分每个节点的支持度,支持度取节点原有支持度和M支持度中的较大者。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于杭州尚青科技有限公司,未经杭州尚青科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201710982410.4/1.html,转载请声明来源钻瓜专利网。
- 同类专利
- 专利分类
G06Q 专门适用于行政、商业、金融、管理、监督或预测目的的数据处理系统或方法;其他类目不包含的专门适用于行政、商业、金融、管理、监督或预测目的的处理系统或方法
G06Q10-00 行政;管理
G06Q10-02 .预定,例如用于门票、服务或事件的
G06Q10-04 .预测或优化,例如线性规划、“旅行商问题”或“下料问题”
G06Q10-06 .资源、工作流、人员或项目管理,例如组织、规划、调度或分配时间、人员或机器资源;企业规划;组织模型
G06Q10-08 .物流,例如仓储、装货、配送或运输;存货或库存管理,例如订货、采购或平衡订单
G06Q10-10 .办公自动化,例如电子邮件或群件的计算机辅助管理