[发明专利]一种知识驱动的业务操作图谱构建方法有效
申请号: | 202011499939.9 | 申请日: | 2020-12-18 |
公开(公告)号: | CN112507136B | 公开(公告)日: | 2023-07-14 |
发明(设计)人: | 暴利花;杨理想;王银瑞;苏洪全;刘海龙;吕宁;黄宁宁;冯小猛;周祥军;宋丽娜 | 申请(专利权)人: | 中国电子科技集团公司第十五研究所 |
主分类号: | G06F16/36 | 分类号: | G06F16/36;G06F16/33;G06F16/35;G06F40/295;G06F40/30;G06F18/23;G06F18/241;G06N3/0442;G06N3/0464;G06N3/048;G06N3/08 |
代理公司: | 南京中律知识产权代理事务所(普通合伙) 32341 | 代理人: | 沈振涛 |
地址: | 100000 北*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 知识 驱动 业务 操作 图谱 构建 方法 | ||
1.一种知识驱动的业务操作图谱构建方法,其特征在于:是基于全网领域知识驱动的业务操作图网络构建方法,包括基于多源异构业务数据的知识生成与领域知识图谱构建和基于作业模式演变的全网领域操作图网络构建两部分;
其中所述基于多源异构业务数据的知识生成与领域知识图谱构建包括基于多模态全链路多维度业务数据的知识萃取与关联处理、基于多源萃取知识的协同建模与图谱生成和基于业务领域知识自主发现的知识图谱拓展;
所述基于作业模式演变的全网领域操作图网络构建,包括基于作业模式演变的全网领域操作图网络构建、基于业务操作发现的操作图谱自动拓展;
所述基于多模态全链路多维度业务数据的知识萃取与关联处理,是通过对文本情报的提取、图像和视频情报的提取进行的;
所述文本情报的提取具体步骤为:步骤一:使用NCRF++模型进行命名实体识别,整个模型分为三层,前两层均使用LSTM单元,第三层使用CRF;
步骤二:关系提取;复用NCRF++模型,且通过只保留CRF层输出的最后一个向量,抛弃其余所有向量,将其改成序列到向量的模型;
步骤三:事件提取;通过包括但不限于以下:触发词识别、实践分类、论元识别、角色识别至少一种识别方式进行实践提取;
所述图像和视频情报的提取具体步骤为:设定预训练模型VGG16;加载模型,冻结所有卷积和池化层,使它们的参与在训练过程中不会更新,进而提取图像的特征;根据具体任务,设计剩余的架构;
所述基于多源萃取知识的协同建模与图谱生成,是对实体链接和实体属性值判定、实体关系补全的处理,其中所述实体链接的具体步骤为:
步骤一:构建实体的向量表示:找到待处理实体的每个上下文,提取中心实体和上下文实体的关系,然后为每个中心实体构造词袋向量:
步骤二:使用聚类法,对所有向量表示进行聚类:
①在未标记的数据点中选一个作为形心,初始化簇c;
②获取形心一定半径内的点,标记它们并将它们在簇c中的计数器加1;
③计算这些点的均值,设为新的形心;
④重复第二和步骤三直到形心不再改变;
⑤如果簇c与已有簇的形心距离小于阈值,则合并;
⑥重复1到4步,直到所有样本都已标记;
⑦将每个样本放入访问计数最多的簇中;
所述基于业务领域知识自主发现的知识图谱拓展,包括步骤一:基于暗网探针的知识自动探测与发现,即发现新的知识,监控互联网上多出了哪些新知识,以及哪些新知识需要更新,基于文本相似性函数的公网与暗网进行知识对齐,信息交联;步骤二:基于知识图谱远程监督的知识标注,即利用已构建的知识图谱,标注含有新知识的文本信息,产生知识三元组;步骤三:知识融合,即将知识三元组合并到已构建的知识图谱中进行更新,使知识图谱贴近现状;
基于作业模式演变的全网领域操作图网络构建,是首先将查询图的边分为核心和外围两类,对于核心边及顶点实施复杂度较大的同构及匹配查询,控制候选结果的数据规模,采用最小生成树算法;
然后,采用简单的方式对核心图的检索结果进行外围边的同构及匹配条件判断,从而消解子图匹配问题中复杂动作的数据规模;
基于业务操作发现的操作图谱自动拓展,包括操作模式层的更新:
操作模式层的更新包括:
(1)对于概念的变化,按照数据库、各类业务数据库以及开放信息环境中的数据分类进行更新,通过自主学习框架检测发现新旧概念之间的差异,进行概念更新;
(2)对于概念之间上下位关系的更新,由于更新会涉及到分类层次结构,因此通过自主学习框架检测操作图谱中可能出现的闭环式冲突,根据操作的时间特征进行冲突消解;
(3)概念属性的更新,如果是新增概念属性,可以按照模式图构建过程中的概念属性新增方式处理;如果是对现有属性更新,则需要人工处理;如果当前概念的所有实体中该属性均已被移除,则可以自动把概念属性值移除。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国电子科技集团公司第十五研究所,未经中国电子科技集团公司第十五研究所许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202011499939.9/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种木质家具生产设备
- 下一篇:一种婴儿用无刺激云母爽身粉及其制备方法