[发明专利]一种基于公开数据的企业量化评价方法在审
申请号: | 201811212122.1 | 申请日: | 2018-10-18 |
公开(公告)号: | CN109902908A | 公开(公告)日: | 2019-06-18 |
发明(设计)人: | 綦雪松;贾宏智;刘元琦;迟作为;黄渲婷;李东虎;肖智天;李振新 | 申请(专利权)人: | 国家电网公司;国网吉林省电力有限公司吉林供电公司 |
主分类号: | G06Q10/06 | 分类号: | G06Q10/06;G06F16/953;G06F16/2458 |
代理公司: | 吉林市达利专利事务所 22102 | 代理人: | 陈传林;臧广维 |
地址: | 100031 *** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 信息数据 综合评价 量化评价 企业影响 互联网公开 数据内容 信息评价 影响系数 分析 数据量 求和 逐页 量化 | ||
1.一种基于公开数据的企业量化评价方法,其特征是:具体步骤如下:
1)提取公开的信息数据
对互联网公开的信息数据进行提取,提取的信息数据包括数据量和数据内容;
2)分析提取的信息数据
对提取的信息数据从企业影响力和企业的影响系数分别进行分析,得到企业的信息评价得分;
3)综合评价企业
依据分析结果对企业进行综合评价并加以量化。
2.如权利要求1所述的一种基于公开数据的企业量化评价方法,其特征是:所述步骤1)提取公开的信息数据的提取过程是:
⑴将该企业的企业全称、通用简称设定为企业名称关键词,并设定出现企业名称的页面样本数C,500≤C≤2000;
⑵在主流中文搜索引擎上以设定的企业名称关键词进行搜索;
⑶在搜索结果总页数Y1的页面内容中,在由首页开始、与样本数相同的页面数中,可实现企业名称全匹配、页数为C1的页面归集并储存。
3.如权利要求1所述的一种基于公开数据的企业量化评价方法,其特征是:所述步骤2)分析提取的信息数据中,企业影响力的分析过程是:
⑴为避免相近的关键词对提取的信息数据造成影响,用公式(1)确定企业影响力校核系数
Y2=C1/C (1)
式中:Y2——企业影响力校核系数;
C1——在搜索结果的总页数的页面中与企业名称全匹配的页数;
C——出现企业名称的页面样本数;
⑵用公式(2)量化分析企业的社会影响力
Y=Y1×Y2/100C (2)
式中,Y——企业的社会影响力;
Y1——搜索结果总页数,当Y1<C时,Y2=C1;
Y2——企业影响力校核系数,由公式(1)得出;
C——出现企业名称的页面样本数。
4.如权利要求1所述的一种基于公开数据的企业量化评价方法,其特征是:所述步骤2)分析提取的信息数据中,对搜索结果的页面内容逐页进行企业影响系数的分析,然后将分析结果求和即为企业影响系数值,其过程是:
⑴信息权威度
①根据提取的信息数据来源的级别不同,设定信息来源的级别权威度关键词,将级别权威度关键词与数据内容匹配进行汉字识别,从而将信息划分为国家级、省部级、地市级、县级、其他法人单位、自媒体、自然人和黄页网站八个等级,以T1表示级别权威度系数,并根据级别不同赋予不同系数如下:
国家级——T1=1.0;
省部级——T1=0.6;
地市级——T1=0.4;
县级——T1=0.2;
其他——T1=0.1;
自媒体——T1=0.01;
黄页网站——T1=0.01;
②根据提取的信息数据来源的性质不同,设定信息来源的性质权威度关键词,将性质权威度关键词与数据内容匹配进行汉字识别,从而将信息归类为政府机关信息、行业信息、媒体单位信息、商业网站信息和其他信息的四大类、七种信息,以T2表示性质权威度系数,并根据信息来源性质不同赋予不同的系数如下:
党政机关——T2=1.0;
本行业媒体——T2=0.8;
事业单位——T2=0.8;
行业协会——T2=0.6;
非本行业媒体——T2=0.5;
商业网站信息——T2=0.3;
其他信息——T2=0.1;
③用公式(3)量化分析提取信息的信息权威度
Q=T1×T2 (3)
式中:Q——企业的信息权威度;
T1——信息来源的级别权威度系数;
T2——信息来源的性质权威度系数;
⑵信息正负极性
根据提取的信息数据对企业产生的积极影响和消极影响不同,设定积极影响为正极、消极影响为负极,将信息归类为积极影响、消极影响和无影响,以Z表示,并将数据分为单个的信息:
①预设信息关键词,将对企业的发展具有积极作用的信息关键词设定为积极影响关键词,将对企业的发展具有消极作用的信息关键词列为消极影响关键词,将对企业的发展没有影响的信息关键词列为无影响关键词;
②将预设的信息关键词与数据内容匹配进行汉字识别,从而将提取的信息数据赋予信息正负极性;
③正极性信息,提取到的积极影响关键词数量占提取到的全部关键词数量70%~100%时,将该信息视为正极性信息,Z=1;
④负极性信息,提取到的消极影响关键词数量占提取到的全部关键词数量70%~100%时,将该信息视为负极性信息,Z=-1;
⑤无影响性信息,提取到的积极影响关键词和消极影响关键词数量占提取到的全部关键词数量0~70%、对企业信息的描述无倾向性和搜索结果的页面内容与企业名称关键词不能全匹配时,将该信息视为无影响性信息,Z=0;
⑶信息相关度
用公式(4)量化分析提取信息的信息相关度
式中:X——企业的信息相关度;
S1——该信息中被评价企业被描述的次数;
S2——该信息中非被评价企业被描述的次数;
⑷影响因子
设定信息的不同形式的信息形式关键词,将信息形式关键词与数据内容匹配进行汉字识别,从而将提取信息的不同形式设定为对企业的影响因子K,根据不同信息的具体形式赋予不同值如下:
行政奖惩——K=1.0;
司法裁定——K=0.9;
合同履约——K=0.8;
咨询机构评价——K=0.7;
甲方评价——K=0.6;
产能变化——K=0.5;
人员变化——K=0.5;
舆论评价——K=0.4;
其他——K=0.1;
⑸根据公式(5)得出被评价企业的影响系数
Nn=Q×Z×X×K=T1×T2×Z×X×K (5)
式中,
Nn——第n页的页面信息对被评价企业的影响系数,n为自然数;
Q——企业的信息权威度;
Z——信息的正负极性;
X——该信息与被评价企业的信息相关度;
K——信息的影响因子;
T1——信息来源的级别权威度系数;
T2——信息来源的性质权威度系数;
⑹对企业影响系数的逐页分析结果按照公式(6)求和
式中,N——企业影响系数;
Nn——第n页的页面信息对被评价企业的影响系数,n为自然数,n=C;
C——出现企业名称的页面样本数。
5.如权利要求1所述的一种基于公开数据的企业量化评价方法,其特征是:所述步骤3)依据分析结果对企业进行综合评价并加以量化,其过程是:
⑴设定企业基础分B
⑵信息评价得分P
根据公式(7)或(8)得出企业的信息评价得分
式中:P——信息评价得分;
N——该信息对被评价企业的影响系数;
Z——信息的正负极性;
X——该信息与被评价企业的相关度;
K——信息的影响因子;
T1——信息来源级别的权威度系数;
T2——信息来源性质的权威度系数;
n——自然数,n=C;
C——出现企业名称的页面样本数;
⑶影响力得分L
根据公式(9)得出企业的影响力得分
式中:L——影响力得分;
Y——企业的社会影响力;
C——出现企业名称的样本数;
⑷企业综合评价得分
根据公式(10)得出企业综合评价得分S
S=B+P+L (10)
式中:S——企业综合评价得分;
B——企业基础分;
P——企业信息评价得分;
L——企业影响力得分;
⑸企业评价
设定综合评价得分的分值标准α、β、γ和δ,α、β、γ和δ的分值依次减少,用于企业评价如下:
当S≥α时,企业评价等级为“优秀”;
当β≤S<α时,企业评价等级为“良好”;
当γ≤S<β时,企业评价等级为“一般”;
当δ≤S<γ时,企业评价等级为“较差”;
当S<δ时,企业评价等级为“极差”。
企业的综合评价得分与企业评价等级相对应的级别即为待评价企业的评价等级。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于国家电网公司;国网吉林省电力有限公司吉林供电公司,未经国家电网公司;国网吉林省电力有限公司吉林供电公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201811212122.1/1.html,转载请声明来源钻瓜专利网。
- 同类专利
- 专利分类
G06Q 专门适用于行政、商业、金融、管理、监督或预测目的的数据处理系统或方法;其他类目不包含的专门适用于行政、商业、金融、管理、监督或预测目的的处理系统或方法
G06Q10-00 行政;管理
G06Q10-02 .预定,例如用于门票、服务或事件的
G06Q10-04 .预测或优化,例如线性规划、“旅行商问题”或“下料问题”
G06Q10-06 .资源、工作流、人员或项目管理,例如组织、规划、调度或分配时间、人员或机器资源;企业规划;组织模型
G06Q10-08 .物流,例如仓储、装货、配送或运输;存货或库存管理,例如订货、采购或平衡订单
G06Q10-10 .办公自动化,例如电子邮件或群件的计算机辅助管理