[发明专利]识别未知数据对象在审
申请号: | 201780070177.0 | 申请日: | 2017-11-27 |
公开(公告)号: | CN109964216A | 公开(公告)日: | 2019-07-02 |
发明(设计)人: | M·A·沙;G·S·迈弗尔森;P·D·达姆莱;G·杜迪;A·W·古普塔 | 申请(专利权)人: | 亚马逊科技公司 |
主分类号: | G06F16/13 | 分类号: | G06F16/13 |
代理公司: | 中国国际贸易促进委员会专利商标事务所 11038 | 代理人: | 邹丹 |
地址: | 美国*** | 国省代码: | 美国;US |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 数据对象 数据模式 元数据存储库 数据存储库 可存储 可访问 可执行 检索 存储 分析 | ||
1.一种系统,其包含:
至少一个处理器;以及
存储器,其用于存储程序指令,所述程序指令在被执行时使得所述至少一个处理器执行包括以下的方法:
标识存储在数据存储库中的未知数据对象;
获得所述未知数据对象的至少一部分;
生成对应于多种数据模式中的相应一种的所述部分的一种或多种表示;
分析所述表示以将所述数据模式中的一种标识为所述未知数据对象的所述数据模式;以及
将所述未知数据对象的所述标识的数据模式存储在所述未知数据对象的元数据存储库中。
2.根据权利要求1所述的系统,
其中生成对应于所述多种数据模式中的所述相应一种的所述部分的所述一种或多种表示包含根据所述数据模式中的不同数据模式来解析所述部分以生成所述表示;
其中分析所述表示以标识所述数据模式中的一种包含将所述表示中的一个成功解析的表示的数据模式标识为所述标识的数据模式。
3.根据权利要求1所述的系统,
其中分析所述表示以标识所述数据模式中的一种包含将一种或多种机器学习技术应用于所述表示以将所述表示分类为所述标识的数据模式的数据。
4.根据权利要求1所述的系统,其中所述数据存储库为作为提供商网络的一部分实施的数据存储服务,其中所述至少一个处理器和所述存储器被实施为所述提供商网络中的数据目录服务的一部分,其中元数据数据存储库被实施为所述数据目录服务的一部分,并且其中所述方法另外包含:
经由所述数据目录服务的基于网络的接口接收访问所述未知数据对象的所述元数据存储库的请求;以及
响应于所述请求,经由所述基于网络的接口提供所述未知数据对象的所述数据模式。
5.一种方法,其包含:
标识存储在数据存储库中的未知数据对象;
获得所述未知数据对象的至少一部分;
生成对应于多种数据模式中的相应一种的所述部分的一种或多种表示;
分析所述表示以将所述数据模式中的一种标识为所述未知数据对象的所述数据模式;以及
将所述未知数据对象的所述标识的数据模式存储在所述未知数据对象的元数据存储库中。
6.根据权利要求5所述的方法,其另外包含:
确定所述未知数据对象的压缩方案;以及
根据所述确定的压缩方案解压缩所述未知数据对象的所述部分。
7.根据权利要求5所述的方法,其另外包含确定所述未知数据对象的数据文件类型,其中所述文件类型与所述数据模式一起存储在所述未知数据对象的所述元数据存储库中。
8.根据权利要求5所述的方法,其另外包含:
接收改变所述未知数据对象的所述数据模式的请求;以及
根据所述请求更新所述元数据存储库中的所述数据模式。
9.根据权利要求5所述的方法,
其中生成对应于所述多种数据模式中的所述相应一种的所述部分的所述一种或多种表示包含根据所述数据模式中的不同数据模式来解析所述部分以生成所述表示;
其中分析所述表示以标识所述数据模式中的一种包含将所述表示中的一个成功解析的表示的数据模式标识为所述标识的数据模式。
10.根据权利要求9所述的方法,其中所述方法通过数据目录服务执行,其中根据所述数据模式中的不同数据模式来解析所述部分以生成所述表示包含应用与所述数据模式相关联的多种解析技术,其中所述不同解析技术中的至少一种,其中第一解析技术被提供为所述数据目录服务的一部分,并且其中第二解析技术从所述数据目录服务的客户端接收。
11.根据权利要求5所述的方法,其中分析所述表示以标识所述数据模式中的一种包含将一种或多种机器学习技术应用于所述表示以将所述表示分类为所述标识的数据模式的数据。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于亚马逊科技公司,未经亚马逊科技公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201780070177.0/1.html,转载请声明来源钻瓜专利网。