[发明专利]一种政策发布对比评估系统及方法在审
申请号: | 202111212189.7 | 申请日: | 2021-10-18 |
公开(公告)号: | CN113946653A | 公开(公告)日: | 2022-01-18 |
发明(设计)人: | 朱旭琪;赵晓月;陈汉清;王欢 | 申请(专利权)人: | 安徽清博大数据科技有限公司 |
主分类号: | G06F16/33 | 分类号: | G06F16/33;G06F16/338;G06F16/35;G06Q50/26 |
代理公司: | 暂无信息 | 代理人: | 暂无信息 |
地址: | 230031 安徽省合肥市蜀山经济开*** | 国省代码: | 安徽;34 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 政策 发布 对比 评估 系统 方法 | ||
1.一种政策发布对比评估系统,其特征在于,包括数据采集模块、分类提取模块、检索匹配模块、排序展示模块、报告生成模块;
所述数据采集模块用于采集政府面向企业的各类政策文本,并将采集到的政策文本进行格式转换,形成统一文本格式,再将信息储存入系统,形成统一标准的政策数据中台;
所述分类提取模块用于将待检测管理机构的对比政策进行读取,再将格式文本转换成与数据中台统一格式,在文本中提取关键字,生成关键词组并将关键词组发送至政策数据中台;
所述检索匹配模块将分类提取模块发送的关键词组在数据中台中检索匹配,产生系列命中结果集并发送给排序展示模块;
所述排序展示模块用于读取命中结果集,对命中结果集的各个条目数据按规模、时间、单位、区域进行统计排序和可视展示,并提供结果集的关键词组,再将关键词组发送给报告生成模块;
所述报告生成模块用于接收排序展示模块的关键词组,用户可根据自身实际需求,自定义首页显示的数据模块以及图表展现方式。
2.根据权利要求1所述的一种政策发布对比评估系统,其特征在于,所述关键词组为使用多组词组通过机器学习训练得出的,关键词组采用Doc2Vec模型,采用政策文件文本作为训练样本,对模型进行训练;采用结巴分词器计算方法进行训练,生成分词库;采用Word2Vec算法对分词进行向量化,生成关键词组。
3.根据权利要求1所述的一种政策发布对比评估方法,其特征在于,所述方法包括以下步骤:
A、数据采集模块根据政策文本发布时间、管理办法文本、项目截止时间、实行的工作方式、采取的一般步骤、遵循的行动原则进行文章搜索,并抓取文章标题;
B、将搜索到的文章进行分类下载,再转换为统一格式,提取关键字后存入数据中台;
C、分类提取模块对待检测的政策文章进行数据处理,删除连词、介词、代词这类结构性词汇、去除动词、形容词、副词这类词汇,提取名词组成关键词组,再将关键词组发送至数据中台;
D、检索匹配模块将两组关键词组在数据中台内检索匹配,将相同、相近的词组进行标记和储存,产生系列命中结果集并发送给排序展示模块;
E、排序展示模块将结果集进行词频计算得出相似程度,按规模、时间、单位、区域将数据源得出的词汇进行横向对比,统计排序和可视展示;
F、报告生成模块根据统计结果,对目标政策与整体结果集的结果进行分维度比较,产生实时查询比较报告,报告可以图表或者数据展示呈现。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于安徽清博大数据科技有限公司,未经安徽清博大数据科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202111212189.7/1.html,转载请声明来源钻瓜专利网。