[发明专利]一种基于多元回归的渔港船舶进出港动态预测方法及系统有效
申请号: | 201910325183.7 | 申请日: | 2019-04-22 |
公开(公告)号: | CN110175696B | 公开(公告)日: | 2020-03-27 |
发明(设计)人: | 蒋庆朝;鲁峰;刘慧媛;陈孟婕;徐硕;王宇;李奥;王振洲 | 申请(专利权)人: | 中国水产科学研究院渔业工程研究所 |
主分类号: | G06Q10/04 | 分类号: | G06Q10/04;G06Q50/02 |
代理公司: | 北京辰权知识产权代理有限公司 11619 | 代理人: | 李小朋;谷波 |
地址: | 100141 *** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 多元 回归 渔港 船舶 进出 动态 预测 方法 系统 | ||
1.一种基于多元回归的渔港船舶进出港动态预测方法,其特征在于,包括:
信息采集集成步骤,采集预测所需的数据集,包括实际船舶进出渔港流量和影响停泊的外部环境因素;
数据预处理步骤,对采集的数据集进行初步处理、清除异常数据,规范文本格式表达形式和取值范围;
多元回归拟合步骤,输入自变量环境数据和因变量船舶进出港数量,计算多元回归函数系数,并进行验证优化,生成预测函数;
所述的数据预处理步骤包括:
数据清洗步骤,对数据集所有的数据对象进行处理,包括异常状态的数据识别和清除,文本描述格式的数据转成数值格式,统一不同对象的取值范围;
数据密度判断步骤,根据数据分布的密度进行分类,把数据集分为低密度数据集和高密度数据集;
数据聚集步骤,对高密度的数据集进行聚类,取每一类的中心点作为该类的属性;
数据输出步骤,对低密度数据集和高密度数据集进行整理,形成新的数据集;
所述数据聚集步骤,包括;
设D={d1,d2,…dm}表示数据集,m为数据的个数,C={c1,c2…ck}表示k个簇,则
sij=||di-cj||2
其中,sij代表数据di与中心点cj的距离,把di放入到距离最近的中心点的集合,然后重新计算中心点;
其中,Cj是中心点cj的集合。
2.如权利要求1所述的渔港船舶进出港动态预测方法,其特征在于,所述信息采集集成步骤包括:
目标数据源确定步骤,确定需要采集的数据,包括天气、风速、温度、日期、历史停泊渔船数量、实际进出渔港船舶数量;
数据采集步骤,采用爬虫的方式从网络上采集需要的数据;
数据集成步骤,对采集的数据进行处理,提取关键信息,整合得到带有映射关系的数据集。
3.如权利要求1所述的渔港船舶进出港动态预测方法,其特征在于,所述多元回归拟合步骤包括:
数据输入步骤,根据环境因素数量,设置对应的多元函数,每一个环境因素代表一个自变量,把数据集转换成空间向量形式,输入数据集中的自变量和因变量;
系数解析步骤,对于输入的数据,以函数预测的结果与实际结果的差的平方和作为误差函数,计算误差函数的最小值,取得对应的函数系数;
输出验证步骤,将用来测试的数据输入到生成的多元函数中,计算出预测的渔船进出港数量。
4.如权利要求1所述的渔港船舶进出港动态预测方法,其特征在于,所述数据清洗步骤包括:根据局部异常因子的方法,找出数据集中与其他数据疏远的点,从数据中删除。
5.如权利要求3所述的渔港船舶进出港动态预测方法,其特征在于,
所述数据输入步骤包括:设Xij表示第i组数据中第j个环境自变量,αi是该变量的系数,yi是这组环境变量下的预测进出港船舶数量,则
y=Xα
其中y是预测的进出港船舶数量,X是环境自变量输入矩阵,α是系数矩阵。
6.如权利要求5所述的渔港船舶进出港动态预测方法,其特征在于,
所述系数解析步骤包括:设是实际进出港船舶数量,σ2是误差函数:
σ2取最小值时,对每个αi的偏导数都为0,即
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国水产科学研究院渔业工程研究所,未经中国水产科学研究院渔业工程研究所许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910325183.7/1.html,转载请声明来源钻瓜专利网。
- 上一篇:针对春节期间的货量预测方法及系统
- 下一篇:一种不良事件风险预测系统及方法
- 同类专利
- 专利分类
G06Q 专门适用于行政、商业、金融、管理、监督或预测目的的数据处理系统或方法;其他类目不包含的专门适用于行政、商业、金融、管理、监督或预测目的的处理系统或方法
G06Q10-00 行政;管理
G06Q10-02 .预定,例如用于门票、服务或事件的
G06Q10-04 .预测或优化,例如线性规划、“旅行商问题”或“下料问题”
G06Q10-06 .资源、工作流、人员或项目管理,例如组织、规划、调度或分配时间、人员或机器资源;企业规划;组织模型
G06Q10-08 .物流,例如仓储、装货、配送或运输;存货或库存管理,例如订货、采购或平衡订单
G06Q10-10 .办公自动化,例如电子邮件或群件的计算机辅助管理