[发明专利]不利用字典管理的通用唯一资源在审
申请号: | 201811599975.5 | 申请日: | 2018-12-26 |
公开(公告)号: | CN110046158A | 公开(公告)日: | 2019-07-23 |
发明(设计)人: | A·尤通;P-S·兰弗兰基;D·E·图克斯巴里 | 申请(专利权)人: | 达索系统美国公司 |
主分类号: | G06F16/22 | 分类号: | G06F16/22 |
代理公司: | 永新专利商标代理有限公司 72002 | 代理人: | 刘瑜;王英 |
地址: | 美国马*** | 国省代码: | 美国;US |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 索引 数据类型 散列 字典 数据库 通用唯一标识符 读取 关联 存储器 存储文字 直接存储 字典存储 字典访问 字典管理 条目 写入 通用 | ||
本文公开的数据库和方法通过将数据直接存储在索引中(例如,存储文字值或利用通用唯一标识符(UUID))来减少昂贵的字典访问(写入和读取),从而节省时间和存储器。一个示例实施例是包括字典和索引的数据库。字典存储键与数据之间的关联。索引中的每个条目包括对应于数据的多个值。索引的值包括(i)针对特定数据类型的对应数据的直接表示,或(ii)针对其他数据类型的对应数据的散列。散列在字典中用作与对应数据相关联的键。
背景技术
最终一致性是在分布式计算中使用的模型,其目标是对项目的所有单 独访问最终将返回相同的值。最终一致的语义Web上系统通常称为BASE (基本可用,软状态,最终一致性)。资源描述框架(RDF)是用于Web上 数据交换的示例标准。RDF使用通用资源标识符(URI)将事物之间的关 系描述为主语、谓语和宾语(称为“三元组”)。URI是用于标识资源的字 符串。URI的一个示例是统一资源定位符(URL),通常称为“web地址”。 RDF可以表示为有向的标记图,其中节点表示Web资源,而节点之间的边 表示资源之间的关系。
允许产生非常大量数据的应用可以受益于使用RDF数据集。在这种情 况下,必须支持产生非常大量的URI。字典可以用于提供对RDF三元组存 储的索引,以帮助优化大量冗余信息的持久性。字典和索引本质上提供三 种操作:(1)插入——将索引归属于RDF节点并将其值存储在字典中,(2) 定位——提供与RDF节点相关联的索引,以及(3)提取——从字典中提 供与索引相关联的值。随着字典增长,定位操作和提取操作可能成本很高, 因为它们要求从远程站点作为整体访问对字典的最新更新,以便分发准确 的索引。插入操作在分散和分布式字典的上下文中可能是有问题的,因为 两个不同的站点可能同时尝试插入相同的资源。
发明内容
通用唯一标识符(UUID)可以在几乎没有冲突风险的情况下在RDF 数据集中用于归属数据标识符。表示为字符串的UUID可能比许多传统URI 更紧凑,为36个字节(即,十六进制格式下每字节两个字母数字字符,以 及根据标准UUID文本形式的四个破折号),但是将UUID作为字符串来操 纵是次优的,因为它的自然二进制表示只有16个字节(128位)。使用字符 串字典处理大量基于UUID的URI会浪费处理器周期和存储器,并且会失 去UUID特征的益处:两个不同站点生成相同UUID是极不可能事件。因 此不太可能将其认为是在不需要交叉验证的情况下建立分散系统的假设。
本文公开的数据库和方法可以利用这一点来减少昂贵的字典访问(写 入和读取),从而节省时间和存储器。一个示例实施例是一种包括字典和索 引的数据库。字典存储键与数据之间的关联。索引中的每个条目包括对应 于数据的多个值。索引的值包括(i)针对特定数据类型的对应数据的直接 表示,或(ii)针对其他数据类型的对应数据的散列。散列在字典中用作与 对应数据相关联的键。
另一示例实施例是一种在数据库中存储数据的计算机实现的方法,其 中数据库包括索引和字典。示例方法包括在字典中存储键与数据之间的关 联。该方法还包括在索引中存储包括对应于数据的多个值的索引。索引的 值包括(i)针对特定数据类型的对应数据的直接表示,或(ii)针对其他数 据类型的对应数据的散列。散列在字典中用作与对应数据相关联的键。
另一示例实施例是一种在计算机存储器中对数据进行存储和取回的方 法。示例方法包括根据索引和字典来配置存储器。索引中的每个条目包括 对应于数据的多个值。字典存储键与数据之间的关联。索引的每个值包括 (i)针对特定数据类型的对应数据的直接表示,或(ii)针对其他数据类型 的对应数据的散列。散列在字典中用作与对应数据相关联的键。
在一些实施例中,数据库可以是资源描述框架数据库,并且索引的多 个值可以包括对应于主语、谓语以及宾语的三个值。在一些实施例中,索 引的值可以包括针对以下任何数据类型的对应数据的直接表示:整数、双 精度、浮点数、八个字符或更少的字符串或通用唯一标识符。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于达索系统美国公司,未经达索系统美国公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201811599975.5/2.html,转载请声明来源钻瓜专利网。