[发明专利]促进基于硬件的表查找的技术在审
申请号: | 202010223398.0 | 申请日: | 2020-03-26 |
公开(公告)号: | CN112134804A | 公开(公告)日: | 2020-12-25 |
发明(设计)人: | A·巴赫姆斯基;R·孔达帕利;F·甘博纳特 | 申请(专利权)人: | 英特尔公司 |
主分类号: | H04L12/743 | 分类号: | H04L12/743;H04L12/863;H04L12/869;H04L12/933;G06F12/06 |
代理公司: | 永新专利商标代理有限公司 72002 | 代理人: | 张立达 |
地址: | 美国加*** | 国省代码: | 暂无信息 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 促进 基于 硬件 查找 技术 | ||
用于促进在一种或多种类型的存储器或存储器域中保存的表的基于硬件的表查找的技术包括接收从队列管理设备转发的搜索请求的示例。示例还包括实现表查找以获得结果,以及将结果发送到队列管理设备的输出队列,以供队列管理设备将结果转发给搜索请求的请求方。
技术领域
描述通常涉及用于促进在一种或多种类型的存储器或存储器域中保存的表的基于硬件的表查找的技术。
背景技术
核心到核心(“C2C”)通信在当今许多计算机应用程序中至关重要,例如分组处理、高性能计算、机器学习、以及与一个或多个应用程序执行相关的数据中心/云工作负载。在芯片多处理器(“CMP”)架构中,随着核心数量的增加,当工作负载共享数据时,C2C通信常常成为性能扩展的限制因素。在通用平台上,常常采用核心之间的共享存储器空间来实现高效的C2C通信。然而,对通过软件仔细管理共享存储器空间的需求以及硬件一致性业务的增加往往会导致大量开销。作为结果,共享一致性缓存的CPU核心和片上网络(NoC)设计通常会经历更长的延迟和更高的数据业务,同时会花费大量资源来实行与通信相关的工作。这可以防止CPU核心和NoC执行其预期的数据处理任务,而不会增加不期望的处理延迟。
通常而言,在CMP平台上通常使用诸如经典Lamport算法之类的软件队列来启用C2C通信。在这些类型的传统软件队列中产生了三种类型的开销。第一种开销包括队列结构保存和同步以及共享存储器的流控制和管理所消耗的周期。该第一类型的开销可以被称为控制平面开销。第二类型的开销包括将数据从一个核心转移到另一个核心所花费的周期。第二类型的开销可以被称为数据平面开销。第三类型的开销包括在发送和接收核心上及时、公平地调度对应的通信实体(包括保存/恢复所需的上下文)。该第三类型可以被称为调度开销。控制平面开销、数据平面开销和调度开销的总和可以等于跨核心传输数据所需的总开销。
用于解决与软件队列相关的大量开销的解决方案是消除在CMP平台上使用软件队列,并且替代地使用基于硬件的队列管理设备。这些基于硬件的队列管理设备可以被称为硬件队列管理器“HQM”,并且也可以被称为队列管理设备(“QMD”)。与将软件队列用于C2C通信相比,将HQM或QMD用于C2C通信可以帮助减少控制平面开销、数据平面开销,并且在某些实现中甚至可以减少调度开销。在一些示例中,HQM或QMD可以被布置为辅助管理被布置为临时保存数据单元的队列。数据单元可以是这样的数据,其由在独立核心上执行的应用所消耗或产生,并且接着经由输入/入口队列和输出/出口队列在单独的核心之间传输。HQM或QMD可以具有内部存储器,其被布置以支持这些输入/入口队列和输出/出口队列。
附图说明
图1示出了示例第一系统。
图2示出了配置电路的示例。
图3示出了查找电路的示例。
图4示出了硬件队列管理器的示例。
图5示出了示例第二系统。
图6示出了示例请求格式。
图7示出了示例表条目格式。
图8示出了示例第一过程。
图9示出了示例第二过程。
图10示出了示例第三过程。
图11示出了示例第四过程。
图12示出了示例第一装置。
图13示出了示例第一逻辑流程。
图14示出了示例第一存储介质。
图15示出了示例第二装置。
图16示出了示例第二逻辑流程。
图17示出了示例第二存储介质。
图18示出了示例计算平台。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于英特尔公司,未经英特尔公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010223398.0/2.html,转载请声明来源钻瓜专利网。
- 上一篇:共享本地存储器读取合并和多播返回
- 下一篇:用于双存储器原子操作的硬件支持