[发明专利]基于一张图通用框架的产业规划精细化解读方法在审
申请号: | 201810204057.1 | 申请日: | 2018-03-13 |
公开(公告)号: | CN108416524A | 公开(公告)日: | 2018-08-17 |
发明(设计)人: | 张同义;韦晓;周永利;马述杰 | 申请(专利权)人: | 泰华智慧产业集团股份有限公司 |
主分类号: | G06Q10/06 | 分类号: | G06Q10/06;G06Q50/26;G06F17/30 |
代理公司: | 北京晟睿智杰知识产权代理事务所(特殊普通合伙) 11603 | 代理人: | 于淼 |
地址: | 250101 山东省济南市高*** | 国省代码: | 山东;37 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 通用框架 精细化 解读 规划 互联网数据 地理编码 关联分析 规划引导 宏观层面 微观层面 指标因素 可视化 模型层 数据层 应用层 递进 分层 引擎 集聚 落地 认知 直观 采集 分解 申请 | ||
1.一种基于一张图通用框架的产业规划精细化解读方法,其特征在于,包括步骤:
建立一张图通用框架,包括数据层、模型层和应用层,其中,
所述数据层在最底层,基于一张图通用技术框架封装的互联网抓取工具、大数据引擎、GIS引擎,定向抓取互联网数据,对接政务部门的业务数据,接入第三方集成数据,对各类数据进行清洗、整合、挖掘分析,建立一张图大数据库,依托地理编码引擎实现数据信息的快速上图应用,数据来源主要有互联网抓取数据、各相关业务部门提供的数据、第三方政务集成数据,建成的一张图大数据库包含二维三维的基础地理信息库、楼宇、企业、项目、土地、税源专题库、经济运行专题库,所述相关业务部门为发改、工信、统计、税务和工商;
所述模型层,一张图通用技术框架封装了经济数学模型方法,包括描述性统计分析模型算法、计量统计分析模型算法、专业决策性分析模型算法;
所述应用层,为发改委和经信委提供辅助决策服务,包括产业宏观规划的精准管理、经济运行分析监测、企业精准服务,服务于政府管理人员、规模以上企业及中小企业、社会公众在工作和生活中对于产业信息的特定化需求;
产业要素集聚,产业要素集聚以产业规划、功能片区、行业、产业载体、配套设施为主体进行集聚,所述产业规划包括主体功能区规划、产业规划,功能片区是指依据产业规划和区域发展特色规划的地区功能片区布局,所述行业包括国民经济行业分类和具有区域特色的行业分类,所述产业载体是地区的楼宇、企业、项目、税源具有产业特性的载体,包含基本属性、空间属性、和经济指标信息,所述配套设施包括交通设施、医疗结构、商业网点、教育机构、科研院所、金融机构和餐饮;
互联网数据采集,通过一张图通用框架封装的互联网抓取工具实现对企业数据和社会经济指标数据的定向抓取和清洗应用,抓取策略为宽度优先遍历,并按照类别、行业、区域元素,利用K-means聚类、Adaboost分类以及增量强化学习算法,形成分布式网络爬虫的最优采集更新策略,同时通过网页模板自动识别功能,对目标网页进行分析,抽取特征属性,将属性值采集至数据表中作为训练样本数据进行聚类,得到多个不同的网页模板;
地理编码引擎,采用一张图通用框架中的地理编码引擎,基于互联网爬取的数据和一张图大数据湖提供的数据持续更新地址库,根据所给的原始地址确定地址模型、基于指定的模型进行地址拆分和标准化、进行地址匹配、确定最佳匹配记录、以及实现地址定位;
以及产业要素快速上图,建立一张图大数据湖,提供持久化引擎运行所需的数据资源,包括实现地理编码所依赖的地名地址库和特征词库、作为背景知识进行地址关联学习的知识库、以及用于词频统计和训练的语料库;依托一张图通用框架封装的地理编码引擎,将从发改委、工商局、统计局、税务部门对接的产业规划相关数据及互联网采集的企业和经济指标数据进行正向地理编码服务,实现地址或地名描述转换为地理信息系统中相应空间位置的快速上图,同时实现反向地理编码服务,通过坐标定位引擎为用户提供地理信息系统中某个地物的行政区划、所处街道的位置信息,并将获取的位置数据存储到一张图大数据湖中,为产业要素快速上图提供数据载体。
2.根据权利要求1所述的基于一张图通用框架的产业规划精细化解读方法,其特征在于,所述根据所给的原始地址确定地址模型,进一步为产业规划类应用制定地址编码标准规范,包括7类地址模型因素:
单一成分:待解析的目标地址是一个独立的实体地址,只对应一个模型属性,不需要分词;
邮政编码:目标地址全是邮政编码,不需要分词;
社区:包括社区名称、编号;
街巷:街巷包括街道名称和巷道名称;
楼号:街巷的楼牌号码;
门牌号:街巷的门牌号码;
标志物:指有意义的建筑物,名称能唯一标定的地点,标志物具有相对的稳定性,一定时间内不会变化。
3.根据权利要求1所述的基于一张图通用框架的产业规划精细化解读方法,其特征在于,所述地理编码引擎包含:数据层、管理层、应用层,其中所述数据层用于将一张图大数据湖中涉及到的空间信息数据抽取出来,形成地理编码数据库,建立并维护空间、非空间索引,提供基础性的地理编码数据服务;管理层用于对地理编码数据库的管理维护,包括地理编码引擎的创建、模式信息的管理与维护;应用层用于通过接入处理完成的数据,实现相应的地址定位服务和辅助决策要求。
4.根据权利要求1所述的基于一张图通用框架的产业规划精细化解读方法,其特征在于,所述互联网数据采集包括步骤:
确定采集任务;
确定采集范围;
确定目标数据源,每个采集任务,有多个目标数据源供采集;
确定监控的网站数据,根据需要采集的网站内容来确定;
配置采集任务,针对不同的网站以及内容,进行不同的采集配置,确保采集到有效数据;
调度采集任务,与目标站点同步更新,增量采集,数据转化和清洗;
采集到数据结果,完成数据异构到同构,完成数据个体化。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于泰华智慧产业集团股份有限公司,未经泰华智慧产业集团股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201810204057.1/1.html,转载请声明来源钻瓜专利网。
- 同类专利
- 专利分类
G06Q 专门适用于行政、商业、金融、管理、监督或预测目的的数据处理系统或方法;其他类目不包含的专门适用于行政、商业、金融、管理、监督或预测目的的处理系统或方法
G06Q10-00 行政;管理
G06Q10-02 .预定,例如用于门票、服务或事件的
G06Q10-04 .预测或优化,例如线性规划、“旅行商问题”或“下料问题”
G06Q10-06 .资源、工作流、人员或项目管理,例如组织、规划、调度或分配时间、人员或机器资源;企业规划;组织模型
G06Q10-08 .物流,例如仓储、装货、配送或运输;存货或库存管理,例如订货、采购或平衡订单
G06Q10-10 .办公自动化,例如电子邮件或群件的计算机辅助管理