[发明专利]一种农产品价格数据的提取方法、装置及设备在审
申请号: | 201811543073.X | 申请日: | 2018-12-17 |
公开(公告)号: | CN109614538A | 公开(公告)日: | 2019-04-12 |
发明(设计)人: | 王铭锋;左亚尧 | 申请(专利权)人: | 广东工业大学 |
主分类号: | G06F16/951 | 分类号: | G06F16/951;G06F16/24;G06F17/27 |
代理公司: | 北京集佳知识产权代理有限公司 11227 | 代理人: | 罗满 |
地址: | 510060 广东省*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明公开了一种农产品价格数据的提取方法、装置、设备及计算机可读存储介质,该方法包括:由目标网页爬取得到对应文本,确定内容主题为农业主题的文本为目标文本,对目标文本分词处理得到对应目标词组;提取目标词组包含的农产品信息为目标农产品信息,判断目标农产品信息是否包含农产品价格,如果是,则确定数据提取完成,将目标农产品信息存入数据库,如果否,则由数据库中查找与目标农产品信息具有关联性的农产品信息,基于查找到的农产品信息与目标农产品信息的关联性确定目标农产品信息对应的农产品价格,将确定出的农产品价格加入目标农产品信息后保存至数据库。从而有效解决了现有技术提取的农产品价格数据不完整、缺失部分较多的问题。 | ||
搜索关键词: | 农产品信息 农产品价格 数据库 目标文本 词组 关联性 计算机可读存储介质 文本 装置及设备 分词处理 目标网页 内容主题 数据提取 有效解决 查找 保存 | ||
【主权项】:
1.一种农产品价格数据的提取方法,其特征在于,包括:由目标网页中爬取得到对应的文本,确定其内容主题为农业主题的文本为目标文本,并对所述目标文本进行分词处理得到对应的目标词组;提取所述目标词组中包含的农产品信息为目标农产品信息,判断所述目标农产品信息中是否包含农产品价格,如果是,则确定数据提取完成,并将所述目标农产品信息存入至数据库中,如果否,则由所述数据库中查找与所述目标农产品信息具有关联性的农产品信息,基于查找到的农产品信息与所述目标农产品信息的关联性确定所述目标农产品信息对应的农产品价格,并将确定出的农产品价格加入所述目标农产品信息后保存至所述数据库。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于广东工业大学,未经广东工业大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201811543073.X/,转载请声明来源钻瓜专利网。