[发明专利]用于通过统计剖析和参考模式匹配进行本体归纳的系统和方法有效
申请号: | 201780012429.4 | 申请日: | 2017-08-22 |
公开(公告)号: | CN108701258B | 公开(公告)日: | 2022-12-27 |
发明(设计)人: | A·S·斯托贾诺维克;H·H·纳玛瓦尔;D·阿兰;G·西萨拉曼 | 申请(专利权)人: | 甲骨文国际公司 |
主分类号: | G06N5/02 | 分类号: | G06N5/02;G06F9/50 |
代理公司: | 中国贸促会专利商标事务所有限公司 11038 | 代理人: | 刘玉洁 |
地址: | 美国加*** | 国省代码: | 暂无信息 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 用于 通过 统计 剖析 参考 模式 匹配 进行 本体 归纳 系统 方法 | ||
1.一种用于与数据集成或其他计算环境一起使用的方法,包括:
在包括处理器的计算机处提供用于创建执行数据处理的数据流水线和数据流软件应用的设计时系统,其中数据流软件应用进行操作以从包括第一数据集的一个或多个数据源接收数据,并且将该数据提供给包括第二数据集的一个或多个数据目标,
其中数据流包括一个或多个数据源和数据目标的规范,所述一个或多个数据源和数据目标作为HUB操作并包括具有与其相关联的属性的数据集,
其中数据流与对一个或多个输入数据集操作以将数据变换和输出到一个或多个输出数据集的语义动作相关联;
其中与数据流相关联的软件应用进行操作来对数据集或实体执行一个或多个语义动作用于投影到另一个实体上,这包括接收数据集输入以及根据与所述软件应用相关联的所述数据流来产生数据集输出,所述提供用于创建执行数据处理的数据流水线和数据流软件应用的设计时系统包括:
从一个或多个数据源接收数据,以及
处理所述数据用于传送到一个或多个数据目标;
其中所述软件应用能够部署到执行所述数据流水线和软件应用的运行时系统;
其中所述设计时系统包括存储与数据源和数据目标相关联的元数据的知识源;
接收定义描述特定数据源或数据目标内的实体定义的一个或多个参考模式的输入;
访问所述一个或多个参考模式,以获得与通过参考一个或多个模式而提供的实体相关联的一个或多个实体定义,其中实体定义至少包括属性定义、数据类型以及业务规则或约束、数据集或实体之间的关系;
从所述一个或多个参考模式生成用于所述一个或多个实体的与所述特定数据源或数据目标相关联的样本数据;
剖析所述样本数据,以确定与所述样本数据相关联的一个或多个度量;
基于实体定义和度量,生成一个或多个规则;以及
基于所生成的一个或多个规则来生成功能类型系统,以用于处理数据输入,其中处理数据输入包括更新知识源和存储在其中的元数据。
2.如权利要求1所述的方法,其中所述一个或多个规则包括依据剖析的数据属性或复合值度量定义的数据规则;定义跨实体和属性向量的关联的关系规则;以及能够通过数据规则和关系规则的组合得出的复杂规则。
3.如权利要求1或2所述的方法,其中所述一个或多个模式在参考HUB中提供。
4.如权利要求1或2所述的方法,其中所述功能类型系统被持久化到知识源。
5.如权利要求4所述的方法,其中所述知识源是系统HUB。
6.如权利要求1或2所述的方法,其中所述一个或多个模式作为参考本体操作,以用于对由注册的HUB提供的元数据模式或本体进行类型标记、比较、分类或以其它方式进行评估。
7.如权利要求1或2所述的方法,其中所述方法在云或基于云的计算环境中执行。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于甲骨文国际公司,未经甲骨文国际公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201780012429.4/1.html,转载请声明来源钻瓜专利网。