[发明专利]一种互联网+环境下文化创新企业知识缺口的识别方法有效
申请号: | 202010987288.1 | 申请日: | 2020-09-18 |
公开(公告)号: | CN112132444B | 公开(公告)日: | 2023-05-12 |
发明(设计)人: | 张健;齐林;张烁;廖梦洁;陈进东;王宗水 | 申请(专利权)人: | 北京信息科技大学 |
主分类号: | G06Q10/0637 | 分类号: | G06Q10/0637;G06F40/30;G06N3/042;G06N3/084 |
代理公司: | 济南泉城专利商标事务所 37218 | 代理人: | 张贵宾 |
地址: | 100000 北*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 互联网 环境 文化 创新 企业 知识 缺口 识别 方法 | ||
1.一种互联网+环境下文化创新企业知识缺口的识别方法,其特征在于:该方法包括以下步骤:
S1、构建“互联网+”环境下的知识全集网络:
运用无向加权的连通图G=(V,E),
节点V={v1,v2,…,vm}表示知识主题,边E={eij|vi,vj∈V}表示主题间关联,eij的权值dij是主题vi和vj的关联强度,dij越大关联越强,即确定节点集V、关联集E和任意节点间关联强度dij的过程;
S2、向量化知识主题语义:
将网络化的知识载体文本表征为词向量的语义信息,并获取语义相似度;
S3、构建文化创新企业储备知识主题网络:
运用无向加权的连通图G'=(V',E'),其中:
S4、识别需求知识主题及需求知识主题中的知识缺口:
抽取需求知识载体文本中的主题词,通过词频和逆向文档频率完成需求知识主题识别,在识别需求知识主题的基础上,识别需求知识主题中的知识缺口;
在步骤S2中,
通过给定输入词进行语义预测的过程,令ωt为当前词,c为上下文窗口长度,则p(ωi|ωt)(t-c≤i≤t+c)为当前词与窗口内某一词共同出现的概率,模型的训练目标是让下式中H最大,
T为文本长度,每轮训练后采用Softmax分类函数计算损失并进行反向传播,训练结束后,从神经网络的隐层提取主题vi的向量表示vi=(Si1,Si2,...,Sin),n为向量维度,Sin为该向量第n维的值,以Pearson相关系数表示主题vi和vj的语义关联度dij,形式为
为主题vi和vj的向量表示中所有维度的均值;dij越大,主题vi和vj间的语义关联越强;
在步骤S3中,
储备知识主题网络的主题关联包含共现关联和语义关联,其中:
共现关联度通过主题词共现频次分析获得并进行量化,其形式为
tfij为主题词vi和vj在同一文档中共现数,tfi为主题词vi出现总次数,tfj为主题词vj出现总次数,Oij为主题词vi和tj之间的系数,Oij越大,主题vi和vj之间的共现关联越强;主题词vi和vj在储备知识主题网络中关联度为:
Rij=1-(βOij+(1-β)dij)
β∈(0,1)为权重系数;
以储备知识主题网络中知识主题间的关联度修正知识全集网络的主题关联度,具体为
在步骤S4中,词频tfij表示为
nij是词vi在文档dj中出现的频率,是文档dj中所有词出现的总频率;
逆向文档频率idfi表示为
|D|为描述需求知识的总文档数,|{j:ti∈dj}|为包含vi的文档数;
同时考虑词频tfij和逆向文档频率idfi,某一主题词的重要度为tfidfi=tfij*idfi
设定重要度阈值α,则需求知识主题集合V”={vi|vi∈V且tfidfiα},
对需求知识主题集合V”,计算
作为需求知识主题vi在需求知识主题集合中的权重,需求知识主题集合V”的权重系数矩阵写成
A=(tfidf1',tfidf2',…,tfidfn')
其中n是V”中的元素个数;
在步骤S5中,针对需求知识主题vi运用特征向量中心度刻画组织的储备知识主题网络中某一知识主题的重要度,其形式为
γ为一个比例常数,Rij是主题vi和vj在储备知识主题网络中的关联度,Ei是主题vi在储备知识主题网络中的特征向量中心度,Ej则是主题vi的邻居主题vj的特征向量中心度;
对于vi∈V”,Ei就反映了储备知识主题网络满足需求知识主题vi的能力,对知识主题满足能力进行模糊化,为将精确的特征向量中心度向知识满足能力的模糊论域映射,建立模糊评价集合
U={u1,u2,u3}
分别表示知识主题满足能力差、一般和好的隶属度,其线性隶属度函数定义为
其中0≤a<b<c<d≤1,根据上式计算需求知识主题集合V”中的主题vi对各能力级别的隶属度,得到模糊关系矩阵
通过模糊相容计算,得到组织面向需求知识主题集合时的知识满足能力模糊评价向量B=A·R。
2.根据权利要求1所述的互联网+环境下文化创新企业知识缺口的识别方法,其特征在于:根据模糊评价向量B中各分量的隶属度分布,识别所面向文化创新企业知识满足能力:
对于满足能力评价为好的,意味着需求知识主题集V”在知识储备网络中既有对应主题,该主题也与邻居主题占据了网络中心位置,表示该文化创新企业长期从事此类主题的知识创新活动,需求知识能完全在组织内得到满足;
对于满足能力为差的,认为需求知识主题集V”所涉及的知识主题未出现在知识储备网络中;
对于满足能力为一般的,认为需求知识主题集V”在知识储备网络中有对应主题,但仍有待于加强提升。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京信息科技大学,未经北京信息科技大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010987288.1/1.html,转载请声明来源钻瓜专利网。
- 同类专利
- 专利分类
G06Q 专门适用于行政、商业、金融、管理、监督或预测目的的数据处理系统或方法;其他类目不包含的专门适用于行政、商业、金融、管理、监督或预测目的的处理系统或方法
G06Q10-00 行政;管理
G06Q10-02 .预定,例如用于门票、服务或事件的
G06Q10-04 .预测或优化,例如线性规划、“旅行商问题”或“下料问题”
G06Q10-06 .资源、工作流、人员或项目管理,例如组织、规划、调度或分配时间、人员或机器资源;企业规划;组织模型
G06Q10-08 .物流,例如仓储、装货、配送或运输;存货或库存管理,例如订货、采购或平衡订单
G06Q10-10 .办公自动化,例如电子邮件或群件的计算机辅助管理