[发明专利]基于机器学习的企业公共信息模型扩展方法及系统在审
申请号: | 201710878007.7 | 申请日: | 2017-09-26 |
公开(公告)号: | CN107609785A | 公开(公告)日: | 2018-01-19 |
发明(设计)人: | 黄晓波;梁哲恒;温柏坚;黄巨涛;林强;唐亮亮;尚艳伟;林细君;郑杰生;臧笑宇;周开东;麦晓晖;唐乐;邰璐璐;段福亮;黄载瑜;朱功峰;曹巍;刘莉 | 申请(专利权)人: | 广东电网有限责任公司信息中心;云南云电同方科技有限公司 |
主分类号: | G06Q10/06 | 分类号: | G06Q10/06;G06N99/00;G06F17/30 |
代理公司: | 北京弘权知识产权代理事务所(普通合伙)11363 | 代理人: | 逯长明,许伟群 |
地址: | 510080 广东省广州*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 机器 学习 企业 公共 信息 模型 扩展 方法 系统 | ||
1.一种基于机器学习的企业公共信息模型扩展方法,其特征在于,所述扩展方法具体包括以下步骤:
建立企业公共信息物理模型数据库,统计已有类的个数X,存储所述已有类的数据信息,所述数据信息包括所述类所属的包以及其属性;
确定扩展类所包含的属性;
随机抽取K个已有类作为初始临近类,根据所述初始临近类和扩展类的属性分别计算所述初始临近类与所述扩展类的相似度,建立包括所述初始临近类及其与所述扩展类的相似度的优先级队列,K<X;
遍历计算除初始临近类外所述已有类与所述扩展类的相似度,比较所述相似度与所述优先级队列中所述初始临近类相似度的大小,找出所述已有类中相似度较大的K个已有类并组成新的优先级队列;
统计所述新的优先级队列中类所属的包内包含类的数目,找出包含类数目最多的包,选择所述包含类数目最多的包作为所述扩展类所属的包,将所述扩展类写入所述包。
2.根据权利要求1所述的扩展方法,其特征在于,遍历计算除初始临近类外所述已有类与所述扩展类的相似度,比较所述相似度与所述优先级队列中所述初始临近类相似度的大小,找出所述已有类中相似度较大的K个已有类并组成新的优先级队列,具体为:
计算除初始临近类外所述已有类与所述扩展类的相似度,记做Lm,找出所述优先级队列中最小的相似度,记做Lmin;
若Lm>Lmin,删除所述优先级队列所述Lmin对应的临近类,将所述L对应的已有类存入所述优先级队列;
若L≤Lmin,保持所述优先级队列不变;
遍历除初始临近类外所述已有类,直至找出所述已有类中相似度较大的K个已有类并组成新的优先级队列。
3.根据权利要求1所述的扩展方法,其特征在于,统计所述新的优先级队列中类所属的包内包含类的数目,找出包含类数目最多的包,选择所述包含类数目最多的包作为所述扩展类所属的包,将所述扩展类写入所述包,还包括:
当类数目最多的包不唯一时,令K=K+1,继续重复操作,直到类数目最多的包唯一。
4.根据权利要求1所述的扩展方法,其特征在于,
5.根据权利要求1所述的扩展方法,其特征在于,每一所述初始临近类与所述扩展类的相似度均不相同,所述临近类属于不同的包。
6.一种基于机器学习的企业公共信息模型扩展系统,其特征在于,所述系统包括:
物理模型数据库,用于统计已有类的个数X,存储所述已有类的数据信息,所述数据信息包括所述类所属的包以及其属性;
扩展类模块,用于确定扩展类所包含的属性;
优先级队列模块,用于随机抽取K个已有类作为初始临近类,分别计算所述初始临近类与所述扩展类的相似度,建立包括所述初始临近类及其与所述扩展类的相似度的优先级队列,K<X;
相似度遍历模块,用于遍历计算除初始临近类外所述已有类与所述扩展类的相似度,比较所述相似度与所述优先级队列中所述初始临近类相似度的大小,找出所述已有类中相似度较大的K个已有类并组成新的优先级队列;
扩展类逻辑处理模块,用于统计所述新的优先级队列中类所属的包内包含类的数目,找出包含类数目最多的包,选择所述包含类数目最多的包作为所述扩展类所属的包,将所述扩展类写入所述包。
7.根据权利要求6所述的扩展系统,其特征在于,所述相似度遍历模块还包括遍历子模块,
所述遍历子模块,用于计算除初始临近类外所述已有类与所述扩展类的相似度,记做Lm,找出所述优先级队列中最小的相似度,记做Lmin;若Lm>Lmin,删除所述优先级队列所述Lmin对应的临近类,将所述L对应的已有类存入所述优先级队列;若L≤Lmin,保持所述优先级队列不变;遍历除初始临近类外所述已有类,直至找出所述已有类中相似度较大的K个已有类并组成新的优先级队列。
8.根据权利要求6所述的扩展系统,其特征在于,所述扩展类逻辑处理模块包括扩展类逻辑处理子模块,
扩展类逻辑处理子模块,用于当类数目最多的包不唯一时,令K=K+1,继续重复操作,直到类数目最多的包唯一。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于广东电网有限责任公司信息中心;云南云电同方科技有限公司,未经广东电网有限责任公司信息中心;云南云电同方科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201710878007.7/1.html,转载请声明来源钻瓜专利网。
- 同类专利
- 专利分类
G06Q 专门适用于行政、商业、金融、管理、监督或预测目的的数据处理系统或方法;其他类目不包含的专门适用于行政、商业、金融、管理、监督或预测目的的处理系统或方法
G06Q10-00 行政;管理
G06Q10-02 .预定,例如用于门票、服务或事件的
G06Q10-04 .预测或优化,例如线性规划、“旅行商问题”或“下料问题”
G06Q10-06 .资源、工作流、人员或项目管理,例如组织、规划、调度或分配时间、人员或机器资源;企业规划;组织模型
G06Q10-08 .物流,例如仓储、装货、配送或运输;存货或库存管理,例如订货、采购或平衡订单
G06Q10-10 .办公自动化,例如电子邮件或群件的计算机辅助管理