[发明专利]基于机器学习的企业公共信息模型扩展方法及系统在审
申请号: | 201710878007.7 | 申请日: | 2017-09-26 |
公开(公告)号: | CN107609785A | 公开(公告)日: | 2018-01-19 |
发明(设计)人: | 黄晓波;梁哲恒;温柏坚;黄巨涛;林强;唐亮亮;尚艳伟;林细君;郑杰生;臧笑宇;周开东;麦晓晖;唐乐;邰璐璐;段福亮;黄载瑜;朱功峰;曹巍;刘莉 | 申请(专利权)人: | 广东电网有限责任公司信息中心;云南云电同方科技有限公司 |
主分类号: | G06Q10/06 | 分类号: | G06Q10/06;G06N99/00;G06F17/30 |
代理公司: | 北京弘权知识产权代理事务所(普通合伙)11363 | 代理人: | 逯长明,许伟群 |
地址: | 510080 广东省广州*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 机器 学习 企业 公共 信息 模型 扩展 方法 系统 | ||
技术领域
本发明涉及企业公共信息模型管理技术领域,尤其涉及一种基于机器学习的企业公共信息模型扩展方法及系统。
背景技术
企业公共信息模型(Enterprise Common Information Model,ECIM)是一个抽象模型,它以IEC 61970/IEC 61968公共信息模型(Common Information Model,CIM)为基础,结合企业自身业务特点,进行适应性删减、调整和扩充,描述企业的信息化建设的主要对象。ECIM通过提供一种用对象类和属性及他们之间的关系来表示电力系统对象的标准方法,可方便实现不同厂商独立开发的业务系统之间的集成并指导业务系统的建设。通过定义一种基于ECIM的公共语言(即语法和语义),使得不同的应用或系统能够基于ECIM形成统一的公共语义,从而可以实现跨信息系统的数据共享和集成。
在ECIM中,设置若干个包,每个包下面包裹若干类,包是一种将相关模型元件分组的通用方法。包的选择是为了使模型更易于设计、理解与查看。ECIM中的每一个类包含描述和识别该类的具体实例的属性,具有相对较高相似度的类被分在一个包中。
随着业务的不断变化,ECIM也需要持续更新,尤其是对于新模型的扩展,需要在确定了扩展类及其类属性的情况下将其划分在合适的某个包内。现有技术中通常采用人工分包,即通过人的主观意识选择认为相近的包,对照该包内类与此扩展类是否具有相近,当具有相对相近的时候,则将所述扩展类划分入该包,否则需要重新选择包在进行对比,直至找到可被划入的包。由于现有ECIM包及每个包内包含的类的基数较大,人工比对会耗费大量的时间和人力,以及人类主观意识易造成判断不准确,给ECIM的扩展造成了很大的困难和不便。
发明内容
本发明提供了一种基于机器学习的企业公共信息模型扩展方法及系统,便于企业公共信息模型中扩展类划分,提高划分效率以及准确性。
根据本发明实施例的第一方面,本发明提供了一种基于机器学习的企业公共信息模型扩展方法,所述扩展方法具体包括以下步骤:
建立企业公共信息物理模型数据库,统计已有类的个数X,存储所述已有类的数据信息,所述数据信息包括所述类所属的包以及其属性;
确定扩展类所包含的属性;
随机抽取K个已有类作为初始临近类,根据所述初始临近类和扩展类的属性分别计算所述初始临近类与所述扩展类的相似度,建立包括所述初始临近类及其与所述扩展类的相似度的优先级队列,K<X;
遍历计算除初始临近类外所述已有类与所述扩展类的相似度,比较所述相似度与所述优先级队列中所述初始临近类相似度的大小,找出所述已有类中相似度较大的K个已有类并组成新的优先级队列;
统计所述新的优先级队列中类所属的包内包含类的数目,找出包含类数目最多的包,选择所述包含类数目最多的包作为所述扩展类所属的包,将所述扩展类写入所述包。
可选的,上述基于机器学习的企业公共信息模型扩展方法中,遍历计算除初始临近类外所述已有类与所述扩展类的相似度,比较所述相似度与所述优先级队列中所述初始临近类相似度的大小,找出所述已有类中相似度较大的K个已有类并组成新的优先级队列,具体为:
计算除初始临近类外所述已有类与所述扩展类的相似度,记做Lm,找出所述优先级队列中最小的相似度,记做Lmin;
若Lm>Lmin,删除所述优先级队列所述Lmin对应的临近类,将所述L对应的已有类存入所述优先级队列;
若L≤Lmin,保持所述优先级队列不变;
遍历除初始临近类外所述已有类,直至找出所述已有类中相似度较大的K个已有类并组成新的优先级队列。
可选的,上述基于机器学习的企业公共信息模型扩展方法中,统计所述新的优先级队列中类所属的包内包含类的数目,找出包含类数目最多的包,选择所述包含类数目最多的包作为所述扩展类所属的包,将所述扩展类写入所述包,还包括:
当类数目最多的包不唯一时,令K=K+1,继续重复操作,直到类数目最多的包唯一。
可选的,上述基于机器学习的企业公共信息模型扩展方法中,
可选的,上述基于机器学习的企业公共信息模型扩展方法中,每一所述初始临近类与所述扩展类的相似度均不相同,所述临近类属于不同的包。
根据本发明实施例的第二方面,本申请提供了基于机器学习的企业公共信息模型扩展系统,所述系统包括:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于广东电网有限责任公司信息中心;云南云电同方科技有限公司,未经广东电网有限责任公司信息中心;云南云电同方科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201710878007.7/2.html,转载请声明来源钻瓜专利网。
- 同类专利
- 专利分类
G06Q 专门适用于行政、商业、金融、管理、监督或预测目的的数据处理系统或方法;其他类目不包含的专门适用于行政、商业、金融、管理、监督或预测目的的处理系统或方法
G06Q10-00 行政;管理
G06Q10-02 .预定,例如用于门票、服务或事件的
G06Q10-04 .预测或优化,例如线性规划、“旅行商问题”或“下料问题”
G06Q10-06 .资源、工作流、人员或项目管理,例如组织、规划、调度或分配时间、人员或机器资源;企业规划;组织模型
G06Q10-08 .物流,例如仓储、装货、配送或运输;存货或库存管理,例如订货、采购或平衡订单
G06Q10-10 .办公自动化,例如电子邮件或群件的计算机辅助管理