[发明专利]一种基于开源数据的企业风险评价系统及方法有效

专利信息
申请号: 201711022805.6 申请日: 2017-10-27
公开(公告)号: CN110020048B 公开(公告)日: 2021-09-14
发明(设计)人: 张守义 申请(专利权)人: 北京宸信征信有限公司
主分类号: G06F16/951 分类号: G06F16/951;G06F16/9535;G06F40/216;G06F40/289;G06Q10/06
代理公司: 北京康思博达知识产权代理事务所(普通合伙) 11426 代理人: 范国锋;刘冬梅
地址: 100036 北京市海淀*** 国省代码: 北京;11
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 一种 基于 数据 企业 风险 评价 系统 方法
【权利要求书】:

1.一种基于开源数据的企业风险评价系统,其特征在于,该系统包括

数据爬取模块(1),其用于从网页中爬取数据,

数据分词模块(2),其用于对数据爬取模块(1)爬取到的数据正文做分词处理,并统计词频;

评分模块(3),其用于根据分词的词频给出企业评分;

在所述数据爬取模块(1)上外接有输入装置(11),通过所述输入装置(11)输入检索信息;

所述数据爬取模块(1)爬取网页数据的过程包括如下步骤:

步骤1,爬取引擎从爬虫模块获得初始请求,

步骤2,爬取引擎将从爬虫模块获得的请求列入任务计划,

步骤3,任务计划返回下一个请求给爬取引擎,

步骤4,爬取引擎将任务计划返回的请求通过下载中间件发送给下载模块,

步骤5,下载模块下载页面,当下载模块下载好页面时会产生一个响应,并通过下载中间件发送给爬取引擎,

步骤6,爬取引擎收到下载模块发送的响应后,通过爬虫中间件发送给爬虫模块,

步骤7,爬虫模块处理爬取引擎发送的响应后,通过爬虫中间件给爬取引擎返回爬取元素和新的请求,

步骤8,爬取引擎将处理过的爬取元素发送给元素管道,然后发送处理请求给任务计划并等待下一个可能的请求,

步骤9,重复上述步骤1-8,直到任务计划没有新的请求为止;

所述分词处理过程中还对爬取到的文章做情感分析,在分词处理中即可获得非负面概率和负面概率,

当非负面概率和负面概率之差介于-0.1和0.1之间时判断文章为中立宣传;当非负面概率与负面概率之差为0.1以上的数值时判断该文章为正面宣传;当非负面概率与负面概率之差为-0.1以下的数值时判断该文章为负面宣传;

所述评分模块(3)包括企业经营管理评分子模块(31)、企业竞争能力评分子模块(32)、企业发展前景评分子模块(33)和行业发展环境评分子模块(34)中的一个或多个,分别得到评分模块(3)所包括的各个子模块的评分,再按照大类权重进行加和得到企业的最终评分;

其中,所述企业经营管理评分子模块(31)的大类权重系数为0.4,企业竞争能力评分子模块(32)的大类权重系数为0.2,企业发展前景评分子模块(33)的大类权重系数为0.1,行业发展环境评分子模块(34)的大类权重系数为0.3;

各个所述子模块中都包括两个以上指标维度判断部,

各个指标维度判断部中都包括两个以上指标项,并对各个指标项分别评分;

将一个指标维度判断部中各指标项的评分相加后与该指标维度的子类权重相乘,得到该指标维度的评分;

各个指标维度评分的和为该子模块的评分;

所述各个指标项中都存储有一个以上指标关键字,并在数据分词模块(2)提取出的分词中找出与指标关键字相同的分词,并获知该分词的词频;

在所述各个指标项中还存储有判断模块,所述判断模块根据总词频或者命中关键字的内容判断出各个指标项的评分;

所述总词频为指标项中所有指标关键字对应/命中分词的词频之和。

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京宸信征信有限公司,未经北京宸信征信有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/201711022805.6/1.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top