[发明专利]识别相同实体模型的数据处理系统有效
申请号: | 202110899046.1 | 申请日: | 2021-08-06 |
公开(公告)号: | CN113342909B | 公开(公告)日: | 2021-11-02 |
发明(设计)人: | 张正义;傅晓航;刘宸;林方 | 申请(专利权)人: | 中科雨辰科技有限公司 |
主分类号: | G06F16/28 | 分类号: | G06F16/28;G06F16/245 |
代理公司: | 北京锺维联合知识产权代理有限公司 11579 | 代理人: | 丁慧玲 |
地址: | 100093 北京*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 识别 相同 实体 模型 数据处理系统 | ||
本发明涉及一种识别相同实体模型的数据处理系统,包括第一预设属性项集合、第二预设属性项集合、存储有计算机程序的存储器和处理器,当所述处理器执行所述计算机程序时,实现A1和A2是否相同的步骤。本发明能够基于实体模型属性项的类型进行实体模型相似度的比较,提高了仿真实验中识别相同实体模型的准确度。
技术领域
本发明涉及计算机技术领域,尤其涉及一种识别相同实体模型的数据处理系统。
背景技术
在现实中,实体是指具体的某个实物,例如“A型温湿度传感器”、“SF-II型元器件”、“58号设备”等。属性项是指每个实体所具有的特征,例如“尺寸大小”、“防水级别”、“可支持最大电压”等。一般情况下,一个实体具有多个属性项,每个属性项包含一条属性值。在仿真模型建立及联合使用时,通常会遇到不同模型中存在同名实体模型,此时实体模型之间的共有属性项个数可能不同,同一属性项的属性值也可能存在差异,因此在使用模型前需要对这类实体模型进行识别,判断它们在模型中是否能够被认为是同一对象。若判断出多个实体模型表征同一对象,则在这些实体模型之间构建对齐关系,对各条属性项进行融合和聚集;若判断出同名的实体模型表征不同对象时,则需要重新建立新的实体模型识别相同实体模型的数据处理系统用以区分。
现有的识别相同实体模型技术中,主要依靠属性项的相似度计算。现有的相似度计算,大多将实体属性项的属性值认定为字符串,通过字符串查重方法或词频统计方法判断两个属性值的相似度。然而在仿真模型中,实体模型的属性值的数据类型存在较大差异,当属性值为数字、日期、列表条目的形式时,现有的识别相同实体模型技术无法准确的判断两个实体模型的相似程度,例如,判别“耐高温”和“抗热性”时,如果只对字符串查重,则会得到二者的相似度很低,而实际上二者的表达的意思十分相近;判别“120℃”与“130℃”时,若仅仅比较数值大小,二者完全不相等,但如果此属性项是“支持最高温度”且本次实验是在常温下进行时,实际上二者在该属性项上可看做是一致的。由此可知,如何提高仿真实验中识别相同实体模型的准确度成为亟待解决的技术问题。
发明内容
本发明目的在于,提供一种识别相同实体模型的数据处理系统,提高了仿真实验中识别相同实体模型的准确度。
根据本发明一方面,提供了一种识别相同实体模型的数据处理系统,包括第一预设属性项集合、第二预设属性项集合、存储有计算机程序的存储器和处理器,当所述处理器执行所述计算机程序时,实现以下步骤:
步骤S1、获取第一属性项列表F1和第二属性列表F2的属性项数量R1、R2,以及F1和F2具有相同属性项列表{C1,C2,…Ck},其中,k为相同属性项数量,Ci为第i个相同属性项,i的取值范围为1到k;
其中,F1用于存储第一实体模型A1的属性项名称和属性值,F2用于存储第二实体模型A2的属性项名称和属性值,基于R1、R2、k确定第一识别参数M:
比较M和预设的参数阈值D1,若M≥D1,则执行步骤S2和/或步骤S3和/或步骤S4,否则,确定A1和A2不相同,结束流程;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中科雨辰科技有限公司,未经中科雨辰科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110899046.1/2.html,转载请声明来源钻瓜专利网。