[发明专利]一种公众对腐败、反腐败关注度指数测量的方法及系统在审
申请号: | 202010847267.X | 申请日: | 2020-08-21 |
公开(公告)号: | CN112364224A | 公开(公告)日: | 2021-02-12 |
发明(设计)人: | 刘品新;徐晶;徐菲;张艺贞;施骏鹏 | 申请(专利权)人: | 中国人民大学 |
主分类号: | G06F16/951 | 分类号: | G06F16/951;G06F16/9535;G06F16/9538;G06F40/289;G06F40/30;G06F40/44;G06Q50/26 |
代理公司: | 北京纪凯知识产权代理有限公司 11245 | 代理人: | 孙楠 |
地址: | 100872 北京市海淀*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 公众 腐败 反腐败 关注 指数 测量 方法 系统 | ||
本发明涉及一种公众对腐败、反腐败关注度指数测量的方法及系统,其包括:在源数据中提取关键词,并计算其权重;根据提取的关键词,获取关键词相关的百度指数数据;根据关键词的权重及其百度指数数据构建关注度指数模型;实时获取网络数据,根据关注度指数模型计算获得腐败、反腐败事件关注度指数,通过关注度指数体现出公众对腐败、反腐败事件的关注程度。本发明能有效的测算不同地区腐败、反腐败事件发生后社会关注程度。
技术领域
本发明涉及一种数据处理技术领域,特别是关于一种根据网络社交大数据测 量公众对腐败、反腐败关注度指数测量的方法及系统。
背景技术
对腐败或反腐败事件的关注程度进行测量,是研究判断腐败情势与反腐败举 措效能的重要手段。这一领域要由简单的经验观察走向客观的指数测量。无论是 在一起重大腐败事件发生后,还是在一项重大的反腐败法律政策出台后,对于各 区域、不同行业民众究竟是否密切关注及有何相关影响因素、作用规律,均需要 开展指数测量。这样的测量结果可以形成对国家或主管部门有效调适腐败治理方 针策略的基础,也成为社会相关行业、企业开发反腐败专门产品服务的支撑。
发明内容
针对上述问题,本发明的目的是提供一种公众对腐败、反腐败关注度指数测 量的方法及系统,其能有效的测算不同地区腐败、反腐败事件发生后社会关注程 度。
为实现上述目的,本发明采取以下技术方案:一种公众对腐败、反腐败关注 度指数测量的方法,其包括:在源数据中提取关键词,并计算其权重;根据提取 的关键词,获取关键词相关的百度指数数据;根据关键词的权重及其百度指数数 据构建关注度指数模型;实时获取网络数据,根据关注度指数模型计算获得腐败、 反腐败事件关注度指数,通过关注度指数体现出公众对腐败、反腐败事件的关注 程度。
进一步,所述源数据包括网络社交大数据及相关政策文件数据内容。
进一步,所述关键词提取及其权重计算具体方法包括以下步骤:
1.1)对源数据进行提取与清洗;
1.2)进行分词操作,并计算获取分词后词语的权重;
1.3)对所有权重进行排序,取前100个词语为公众关注的腐败、反腐败事件 的关键词。
进一步,所述百度指数数据包括搜索指数和地域分布指数。
进一步,采用Python技术开发的网络爬虫来获取相关关键词的全网搜索指数。
进一步,所述关注度指数模型的构建方法包括以下步骤:
3.1)通过互联网络发展状况统计报告,得到各省信息化指数,获得各省市每 年的网络普及率,进而得到各省市几年内的平均网络普及率P;
3.2)合并某个区域的关键词的百度搜索指数,并考虑权重影响,得到初始的 腐败、反腐败事件区域关注度指数模型;
3.3)考虑区域网络普及率的影响,根据初始腐败、反腐败事件区域关注度指 数模型进行建模计算,得到最终的腐败、反腐败事件区域的关注度指数模型。
进一步,所述最终的腐败、反腐败事件区域的关注度指数模型为:
其中,y′为考虑了网络普及率的区域腐败、反腐败事件关注度指数,y为腐败、 反腐败事件区域关注度指数。
进一步,根据关注度指数模型得到最终腐败、反腐败事件关注度指数数据, 构成指数图;根据关注度指数模型计算得到区域腐败、反腐败事件关注指数图, 即为区域图。
进一步,利用web技术提供一个可视化、可交互的在线展示,体现出公众对 腐败、反腐败事件的关注程度;所述在线展示包括指数图和区域图。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国人民大学,未经中国人民大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010847267.X/2.html,转载请声明来源钻瓜专利网。