[发明专利]数据预测方法和数据预测装置在审
申请号: | 201810680495.5 | 申请日: | 2018-06-27 |
公开(公告)号: | CN110717608A | 公开(公告)日: | 2020-01-21 |
发明(设计)人: | 张柯 | 申请(专利权)人: | 阿里巴巴集团控股有限公司 |
主分类号: | G06Q10/04 | 分类号: | G06Q10/04;G06F16/29;G06Q50/26;G06N20/00 |
代理公司: | 11319 北京润泽恒知识产权代理有限公司 | 代理人: | 冀晓恺 |
地址: | 英属开曼群岛大开*** | 国省代码: | 开曼群岛;KY |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 预测点 数据获取 平面区域 机器学习模型 数据预测 地理区 地理 区域特征数据 方法和装置 观测数据 环绕区域 组件确定 准确度 交汇点 预测 地理位置 | ||
本发明实施例提出一种数据预测方法和装置,该数据预测方法包括:确定地理平面区域,所述地理平面区域包括多个地理区格,所述多个地理区格的交汇点构成多个预测点,所述地理平面区域中包括多个数据获取点;依据各个数据获取点获得的观测数据,确定与所述各个数据获取点相邻的预测点的数据;对于与所述各个数据获取点不相邻的预测点,基于以所述不相邻的预测点为中心的环绕区域的区域特征数据,利用机器学习模型组件确定所述不相邻的预测点的数据。本发明利用机器学习模型对地理位置相关的数据进行预测,提高了预测的准确度。
技术领域
本发明涉及信息处理领域,尤其涉及一种数据预测方法和数据预测装置。
背景技术
在一些地理相关的预测场景中,获取数据是提高预测准确程度的瓶颈。例如,在针对某一个区域的预测中,需要将该区域按照经纬度等方式划分成多个子区域,每一个子区域或者子区域的边界对应一个预测点。预测过程需要从每个预测点采集数据信息。但是如果在每一个预测点均架设一个用于获取数据的数据获取点,则会造成成本的大幅增加。
例如,在与地理相关的气象预报的业务场景中,当前所观测到的数据质量直接影响着天气预报的精准度,天气预报是一件非常困难的事情,一个地区未来几小时的天气情况可能不单单跟本地区的指标有关,可能还跟它周边地区当前、过去的指标有关,其地区彼此之间关联性非常强。重要的气象指标一般有降水、风速、湿度、温度、露点温度等,这些基础气象指标是我们进行气象预测的基础,目前只能通过在地面大量架设数据获取点来实时获取。
另一方面,随着气象服务精细化的需求,一般要做到“公里”级别的预报,即在相邻1公里的预测点处,需根据自身预测点所观察到的指标数据,给出不同的天气预报结果。在气象传统的认知当中,要想达到这个目的,就必须在每个相邻一公里的预测点处架设数据获取点,但从成本问题的角度来看,这几乎是不可能完成的任务
但是,由于架设数据获取点的成本太高,架设有数据获取点的有数据预测点只占所有预测点的5%左右,即绝大多数都是无数据预测点。
为了满足每一预测点均有数据的要求,现在业界广泛使用线性插值法获取预测点的数据,即,通过两端有数据的预测点对中间没有预测点的数据进行插值。但线性插值的方法也存在着三个主要的缺点:
首先,线性插值法只能线性单调预测而并不能预测极值。也就是说,利用线性插值法,是人为地假定了中间无数据预测点的值是按两端的观测数据值线性增大或减小,所以无论怎么插值,并不可能出现极值改变单调性,且值的范围永远无法突破两端值的区间。但在实际的气象平面问题中,显然没有这样的假设,极值完全可能出现在无数据预测点当中,甚至有可能大于或小于两个端点值。
其次,线性插值法没有从整个平面填充的角度进行插值。线性插值法从根本来说还是属于点与点之间的预测,并没有将平面上另外的信息考虑进来,导致填充值的预测过于简单粗暴,从而降低了填充的精准度。
再次,线性插值法对于局部有大量无数据预测点的预测效果欠佳。当在一个局部范围内没有有数据预测点或只有少量有数据预测点时,线性插值法并不能将有数据预测点密集地区的填充经验照搬复制过来,还是只能进行机械插值,导致获取的数据不准确。
由上述可知,现有的线性插值法明显达不到获取准确的预测数据、实现精确预测的目的。
除了上述气象预测的场景,在其他与地理位置相关的预测场景中,例如针对交通拥堵状况预测、人流量密度预测,海洋渔情预测等情形,由于数据获取点的成本缘故,现有技术同样是利用插值法预估大多数个点的数据,因此同样具有获取数据不准确、预测效果欠佳的问题。
发明内容
为解决现有技术存在的问题,本发明实施例提出了一种数据预测方法和数据预测装置,以解决现有技术存在的无法获得相对准确的预测数据、导致预测效果欠佳的问题。
本发明一实施例提出一种数据预测方法,包括:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于阿里巴巴集团控股有限公司,未经阿里巴巴集团控股有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201810680495.5/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种航班餐食管理方法及装置
- 下一篇:一种赔偿金的预测方法和装置
- 同类专利
- 专利分类
G06Q 专门适用于行政、商业、金融、管理、监督或预测目的的数据处理系统或方法;其他类目不包含的专门适用于行政、商业、金融、管理、监督或预测目的的处理系统或方法
G06Q10-00 行政;管理
G06Q10-02 .预定,例如用于门票、服务或事件的
G06Q10-04 .预测或优化,例如线性规划、“旅行商问题”或“下料问题”
G06Q10-06 .资源、工作流、人员或项目管理,例如组织、规划、调度或分配时间、人员或机器资源;企业规划;组织模型
G06Q10-08 .物流,例如仓储、装货、配送或运输;存货或库存管理,例如订货、采购或平衡订单
G06Q10-10 .办公自动化,例如电子邮件或群件的计算机辅助管理