[发明专利]农产品价格趋势预测方法有效
申请号: | 201310551702.4 | 申请日: | 2013-11-08 |
公开(公告)号: | CN103577581B | 公开(公告)日: | 2016-09-28 |
发明(设计)人: | 张伟;欧吉顺;周楚新 | 申请(专利权)人: | 南京绿色科技研究院有限公司 |
主分类号: | G06F17/30 | 分类号: | G06F17/30;G06Q10/04 |
代理公司: | 南京纵横知识产权代理有限公司 32224 | 代理人: | 董建林 |
地址: | 210061 江苏省南京市高*** | 国省代码: | 江苏;32 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 农产品 价格 趋势 预测 方法 | ||
1.农产品价格趋势预测方法,其特征在于,包括如下步骤:
步骤一:通过计算机自动采集程序从互联网网站定时采集与农产品价格相关的且带有专家预测性观点的文章;
步骤二:对采集的文章进行去重;
步骤三:从去重后的文章中提取并保存文章要素,所述文章要素包括文章标题、文章正文内容、文章来源、文章发表时间、文章中带有专家预测性观点的语句;
步骤四:根据文章标题和文章正文内容对文章中描述的农产品所属区域进行识别;
步骤五:根据文章中带有专家预测性观点的语句,利用文本挖掘技术分析出专家对农产品的预测性观点,并将所述预测性观点进行量化和保存;
步骤六:根据文章发表时间、农产品所属区域、农产品种类以及量化的趋势预测观点进行计算机建模,利用建立的模型对农产品价格进行趋势预测。
2.根据权利要求1所述的农产品价格趋势预测方法,其特征在于,所述步骤一包括:
步骤1a:设置采集定时器;
步骤1b:设定要采集的互联网网站所对应的入口URL,并将入口URL进行保存,根据采集定时器为所述入口URL分配定时采集任务;
步骤1c:对设定要采集的互联网网站所对应的入口URL进行网页内容下载;
步骤1d:根据网页内容中的HTML标签,定位需要采集的文章对应的URL;
步骤1e:根据需要采集的文章对应的URL,对文章对应的网页内容进行下载并保存。
3.根据权利要求2所述的农产品价格趋势预测方法,其特征在于,所述步骤2b包括:将入口URL保存到本地的XML文件或本地数据库。
4.根据权利要求3所述的农产品价格趋势预测方法,其特征在于,所述步骤二包括:
步骤2a:对每一篇文章对应的URL字符串利用MD5算法进行加密,计算得到所述文章对应的URL的信息指纹;
步骤2b:进行指纹比对,对于信息指纹相同的文章,只保留其中的一篇;
步骤2c:对步骤2b处理后保留的文章按照发表时间的先后进行排序,选择时间最靠前的文章作为基点文章,将基点文章和剩余的文章分别进行两两比对,依次计算基点文章与剩余的文章之间的标题相似度;如果标题相似度大于阈值,则认为二者标题相似,赋予该篇文章与基点文章相同的相似度标识,否则,取其余剩余文章继续与基点文章进行比较,直到剩余全部文章与基点文章比较结束;
步骤2d:比较结束后,若还有未赋予相似度标识的文章,则选择时间最靠前的文章为新的基点文章,并为该篇文章赋予新的相似度标识,剩余的未赋予相似度标识的文章依次与其进行比较;
步骤2e:重复步骤2d,直至不存在未赋予相似度标识的文章;
步骤2f:对于相似度标识相同的文章,只保留其中的一篇。
5.根据权利要求4所述的农产品价格趋势预测方法,其特征在于,所述步骤2c包括:通过相似度计算公式:计算所述标题相似度,其中Sx,y表示基点文章与剩余的文章之间的标题相似度,Nx,y表示基点文章与剩余的文章两者标题中含有的相同的字符数目,Nx表示基点文章标题中含有的字符的总数目;所述阀值为0.9。
6.根据权利要求5所述的农产品价格趋势预测方法,其特征在于,所述步骤三包括:
步骤3a:读取保存的网页内容;
步骤3b:根据网页字符编码对网页内容中的HTML标签进行解析;
步骤3c:根据文章标题、文章正文内容、文章来源、文章发表时间在网页HTML标签中的位置进行相应的提取;
步骤3d:根据文章正文内容和专家观点关键词对文章中带有专家预测性观点的语句进行提取;步骤3e:保存提取的相关文章要素。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于南京绿色科技研究院有限公司,未经南京绿色科技研究院有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201310551702.4/1.html,转载请声明来源钻瓜专利网。