[发明专利]一种政府的政策解构方法及系统有效
申请号: | 201410108269.1 | 申请日: | 2014-03-21 |
公开(公告)号: | CN103955463B | 公开(公告)日: | 2017-05-31 |
发明(设计)人: | 王红星;傅倩倩 | 申请(专利权)人: | 宁波中小在线信息服务有限公司 |
主分类号: | G06F17/30 | 分类号: | G06F17/30;G06Q50/26 |
代理公司: | 上海天翔知识产权代理有限公司31224 | 代理人: | 吕伴 |
地址: | 315040 浙江省宁波*** | 国省代码: | 浙江;33 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明公开了一种政府的政策解构方法及系统,其首先抓取政府政策发布网页,并识别出网页中的政策内容;接着解构识别出的政策内容,获取该政策内容的所有对象属性;再接着根据获取得到的对象属性,将该政策内容以及其对应的对象属性存储到对应的数据表项中;最后根据表项中存储的内容形成对应的查询条件。本方案形成的政府政策解构方案能够自动的获取政策内容,并自动的进行政策解构和存储,形成便于人们查询和了解解构后的信息。 | ||
搜索关键词: | 一种 政府 政策 解构 方法 系统 | ||
【主权项】:
一种政府的政策解构方法,其特征在于,所述解构方法包括如下步骤:(1)抓取政府政策发布网页,并识别出网页中的政策内容;(2)解构识别出的政策内容,获取该政策内容的所有对象属性;(3)根据获取得到的对象属性,将该政策内容以及其对应的对象属性存储到对应的数据表项中;(4)根据表项中存储的内容形成对应的查询条件;所述步骤(1)通过网页信息抓取技术直接抓取政府政策发布网页的页面内容;在进行获取页面内容,首先将处于最大显示状态的页面整体转换形成1:1的图片,接着对图片内容进行识别,识别出图片上对应于政策标题内容的标题区域和对应于政策正文内容的正文区域,具体可根据图片上图案和文字分布的格局进行图片分割,并对各个区域进行识别,根据识别的内容确定对应于政策标题内容的标题区域和对应于政策正文内容的正文区域;再接着根据标题区域和正文区域在图片上的位置,确定页面上用于显示政策标题内容的区域和显示政策正文内容的区域;由于图片的形状大小与页面最大显示状态为1∶1,这样根据图片上标题区域和正文区域的具体位置信息,直接在最大显示状态的页面上确定用于显示政策标题内容的区域和显示政策正文内容区域;最后,直接获取页面上于显示政策标题内容的区域和显示政策正文内容区域中的文字信息;所述步骤(2)中获取到的对象属性包括该政策内容对应的政策类型信息、针对对象信息、办理条件信息、发布时间信息、有效期信息、发布单位信息、办理时间信息、办理地点信息、办理人员信息、受理单位信息、受理时间信息、处理时间信息、针对地区信息、办理所需证件信息、所需证件的有效期信息、办理所需材料信息、所需材料的数量信息;所述步骤(2)中在获取政策类型信息时,利用预存的政策类型关键词遍历识别出的标题内容,根据遍历的结果确定政策类型信息;在获取针对对象时,利用预存的针对对象关键词遍历整个识别出的正文内容,查询到正文内容中关于针对对象的内容并提取出该部分内容;在获取办理条件时,利用获取到的针对对象内容遍历整个识别出的正文内容,查询到正文内容中与针对对象相对应的办理条件的内容并提取出该部分内 容;所述步骤(3)在存储政策内容时,首先根据获取的政策类型将政策内容存储到对应的数据表项中,接着在该表项中存储该政策内容对应的针对对象信息,接着根据针对对象信息对应存储办理条件信息;接着根据办理条件信息对应存储办理所需证件信息和办理所需材料信息;最后将其余的对象属性根据要求对应存储在相应的数据表项中;所述步骤(3)中还通过一关键词表项对应存储数据表项中存储数据对应的关键词;所述步骤(4)中利用表项中存储数据对应的关键词形成相应查询条件。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于宁波中小在线信息服务有限公司,未经宁波中小在线信息服务有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201410108269.1/,转载请声明来源钻瓜专利网。
- 上一篇:一种垃圾清扫机
- 下一篇:浮雕-柱管造型优化环保路桥栅栏