[发明专利]复制元素指令有效
申请号: | 201780076956.1 | 申请日: | 2017-11-10 |
公开(公告)号: | CN110073331B | 公开(公告)日: | 2023-09-12 |
发明(设计)人: | 雅各·埃本;格里戈里奥斯·马格克里斯;姆布·埃约勒 | 申请(专利权)人: | ARM有限公司 |
主分类号: | G06F9/30 | 分类号: | G06F9/30 |
代理公司: | 北京东方亿思知识产权代理有限责任公司 11258 | 代理人: | 林强 |
地址: | 英国*** | 国省代码: | 暂无信息 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 复制 元素 指令 | ||
响应于指定分区信息的复制分区指令,该分区信息定义多个可变大小分区在结果向量内的位置,指令解码器(20)控制处理电路系统(80)以生成结果向量,在该结果向量中,具有多于一个数据元素的每个分区包括源向量中开始或结束于所选数据元素位置的一系列数据元素的数据值或元素索引。该指令对于加速对小于向量长度的数据结构的处理是有用的。
技术领域
本技术涉及数据处理的领域。更具体地,本技术涉及对向量指令的处理。
背景技术
一些数据处理系统支持对向量指令的处理,对此该指令的源操作数或结果值为包括多个数据元素的向量。通过响应于单个指令来支持对若干不同的数据元素的处理,可改良代码密度并降低指令索取及解码的额外负担。可通过将数据值加载至向量操作数的相应元素中并使用单个向量指令一次处理若干元素的数据值来更有效地处理待处理的数据值数组。
发明内容
至少一些示例提供了一种装置,其包括:
处理电路系统,用以对包括多个数据元素的向量执行向量处理操作;以及
指令解码器,用以解码程序指令以控制该处理电路系统来执行向量处理操作;
其中,响应于指定分区信息的复制分区指令,该分区信息定义了多个可变大小分区在结果向量内的位置,每个分区包括结果向量的至少一个数据元素并且至少一个分区包括结果向量的多个相邻数据元素,指令解码器被配置为控制处理电路系统生成结果向量,在该结果向量中,具有多于一个数据元素的每个分区包括源向量中开始或结束于所选数据元素位置的一系列数据元素的数据值或包括以指示所述所选数据元素位置的元素索引开始或结束的一系列递增的元素索引。
至少一些示例提供了一种用于包括处理电路系统的装置的数据处理方法,该处理电路系统用以对包括多个数据元素的向量执行向量处理操作;该方法包括:
解码指定分区信息的复制分区指令,该分区信息定义多个可变大小分区在结果向量内的位置,每个分区包括结果向量的至少一个数据元素并且至少一个分区包括结果向量的多个数据元素;并且
响应于复制分区指令,控制处理电路系统生成结果向量,在该结果向量中,具有多于一个数据元素的每个分区包括源向量中开始或结束于所选数据元素位置处的一系列数据元素的数据值或包括以指示所述所选数据元素位置的元素索引开始或结束的一系列递增的元素索引。
至少一些示例提供了一种存储虚拟机程序的计算机可读存储介质,该虚拟机程序用于控制计算机来提供对应于上文所述的装置的指令执行环境
附图说明
本技术的进一步方面、特征及优点将从结合附图阅读的示例的以下描述中显而易见,其中:
图1示意地示出了支持向量指令处理的数据处理装置的示例;
图2示出了向量处理的示例;
图3示出了复制分区指令的源变换形式的第一示例;
图4至图6示出了复制分区指令的源变换形式的第二示例;
图7至图9示出了复制分区指令的索引生成形式的第三示例;
图10图示出复制分区指令的加载复制形式的示例;
图11是图示出处理复制分区指令的方法的流程图;
图12至图16图示出复制元素指令的源变换形式的示例;
图17图示出复制元素指令的加载复制形式的示例;
图18图示出复制元素指令的索引生成形式的示例;
图19是图示出处理复制元素指令的方法的流程图;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于ARM有限公司,未经ARM有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201780076956.1/2.html,转载请声明来源钻瓜专利网。