[发明专利]基于文本关键字的输电线路设备关联图片爬取方法在审
申请号: | 201710083706.2 | 申请日: | 2017-02-16 |
公开(公告)号: | CN107066521A | 公开(公告)日: | 2017-08-18 |
发明(设计)人: | 何冰;袁奇;王媚;印明骋;王欣庭;赖志超;柴忠良 | 申请(专利权)人: | 国网上海市电力公司 |
主分类号: | G06F17/30 | 分类号: | G06F17/30;G06F21/16 |
代理公司: | 上海科盛知识产权代理有限公司31225 | 代理人: | 赵志远 |
地址: | 200002 *** | 国省代码: | 上海;31 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 文本 关键字 输电 线路 设备 关联 图片 方法 | ||
1.一种基于文本关键字的输电线路设备关联图片爬取方法,其特征在于,包括步骤:
S1:获取文本关键字;
S2:根据获取的文本关键字扩展得到相关关键字;
S3:基于文本关键字和相关关键字利用搜索引擎的图片搜索服务器搜索得到关联图片;
S4:下载关联图片。
2.根据权利要求1所述的一种基于文本关键字的输电线路设备关联图片爬取方法,其特征在于,所述步骤S3具体包括步骤:
S31:基于文本关键字和相关关键字向搜索引擎的图片搜索服务器发送HTTP搜索请求;
S32:接收并获取由搜索服务器返回的关联图片的下载链接;
S33:保存获取的关联图片的下载链接。
3.根据权利要求2所述的一种基于文本关键字的输电线路设备关联图片爬取方法,其特征在于,所述步骤S32包括步骤:
S321:接收由搜索服务器返回的每一张关联图片的下载链接属性;
S322:从反馈的每一张关联图片的下载链接属性中获取该关联图片的下载链接。
4.根据权利要求1所述的一种基于文本关键字的输电线路设备关联图片爬取方法,其特征在于,所述步骤S4中,下载关联图片时更新并保存下载状态和源搜索引擎。
5.根据权利要求1所述的一种基于文本关键字的输电线路设备关联图片爬取方法,其特征在于,所述步骤S4中,采用异步多线程方式下载关联图片。
6.根据权利要求1所述的一种基于文本关键字的输电线路设备关联图片爬取方法,其特征在于,所述步骤S3中,利用多个搜索引擎的图片搜索服务器搜索得到关联图片。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于国网上海市电力公司,未经国网上海市电力公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201710083706.2/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种基于多个语义层次的图片检索方法及系统
- 下一篇:数据库的访问方法和装置