[发明专利]一种基于开源数据的企业风险评价系统及方法有效
申请号: | 201711022805.6 | 申请日: | 2017-10-27 |
公开(公告)号: | CN110020048B | 公开(公告)日: | 2021-09-14 |
发明(设计)人: | 张守义 | 申请(专利权)人: | 北京宸信征信有限公司 |
主分类号: | G06F16/951 | 分类号: | G06F16/951;G06F16/9535;G06F40/216;G06F40/289;G06Q10/06 |
代理公司: | 北京康思博达知识产权代理事务所(普通合伙) 11426 | 代理人: | 范国锋;刘冬梅 |
地址: | 100036 北京市海淀*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 数据 企业 风险 评价 系统 方法 | ||
1.一种基于开源数据的企业风险评价系统,其特征在于,该系统包括
数据爬取模块(1),其用于从网页中爬取数据,
数据分词模块(2),其用于对数据爬取模块(1)爬取到的数据正文做分词处理,并统计词频;
评分模块(3),其用于根据分词的词频给出企业评分;
在所述数据爬取模块(1)上外接有输入装置(11),通过所述输入装置(11)输入检索信息;
所述数据爬取模块(1)爬取网页数据的过程包括如下步骤:
步骤1,爬取引擎从爬虫模块获得初始请求,
步骤2,爬取引擎将从爬虫模块获得的请求列入任务计划,
步骤3,任务计划返回下一个请求给爬取引擎,
步骤4,爬取引擎将任务计划返回的请求通过下载中间件发送给下载模块,
步骤5,下载模块下载页面,当下载模块下载好页面时会产生一个响应,并通过下载中间件发送给爬取引擎,
步骤6,爬取引擎收到下载模块发送的响应后,通过爬虫中间件发送给爬虫模块,
步骤7,爬虫模块处理爬取引擎发送的响应后,通过爬虫中间件给爬取引擎返回爬取元素和新的请求,
步骤8,爬取引擎将处理过的爬取元素发送给元素管道,然后发送处理请求给任务计划并等待下一个可能的请求,
步骤9,重复上述步骤1-8,直到任务计划没有新的请求为止;
所述分词处理过程中还对爬取到的文章做情感分析,在分词处理中即可获得非负面概率和负面概率,
当非负面概率和负面概率之差介于-0.1和0.1之间时判断文章为中立宣传;当非负面概率与负面概率之差为0.1以上的数值时判断该文章为正面宣传;当非负面概率与负面概率之差为-0.1以下的数值时判断该文章为负面宣传;
所述评分模块(3)包括企业经营管理评分子模块(31)、企业竞争能力评分子模块(32)、企业发展前景评分子模块(33)和行业发展环境评分子模块(34)中的一个或多个,分别得到评分模块(3)所包括的各个子模块的评分,再按照大类权重进行加和得到企业的最终评分;
其中,所述企业经营管理评分子模块(31)的大类权重系数为0.4,企业竞争能力评分子模块(32)的大类权重系数为0.2,企业发展前景评分子模块(33)的大类权重系数为0.1,行业发展环境评分子模块(34)的大类权重系数为0.3;
各个所述子模块中都包括两个以上指标维度判断部,
各个指标维度判断部中都包括两个以上指标项,并对各个指标项分别评分;
将一个指标维度判断部中各指标项的评分相加后与该指标维度的子类权重相乘,得到该指标维度的评分;
各个指标维度评分的和为该子模块的评分;
所述各个指标项中都存储有一个以上指标关键字,并在数据分词模块(2)提取出的分词中找出与指标关键字相同的分词,并获知该分词的词频;
在所述各个指标项中还存储有判断模块,所述判断模块根据总词频或者命中关键字的内容判断出各个指标项的评分;
所述总词频为指标项中所有指标关键字对应/命中分词的词频之和。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京宸信征信有限公司,未经北京宸信征信有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201711022805.6/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种科技情报信息管理系统
- 下一篇:域名翻译和查询的方法和装置
- 数据显示系统、数据中继设备、数据中继方法、数据系统、接收设备和数据读取方法
- 数据记录方法、数据记录装置、数据记录媒体、数据重播方法和数据重播装置
- 数据发送方法、数据发送系统、数据发送装置以及数据结构
- 数据显示系统、数据中继设备、数据中继方法及数据系统
- 数据嵌入装置、数据嵌入方法、数据提取装置及数据提取方法
- 数据管理装置、数据编辑装置、数据阅览装置、数据管理方法、数据编辑方法以及数据阅览方法
- 数据发送和数据接收设备、数据发送和数据接收方法
- 数据发送装置、数据接收装置、数据收发系统、数据发送方法、数据接收方法和数据收发方法
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置