[发明专利]用于执行SIMD收集和复制操作的方法和设备有效
申请号: | 201780035161.6 | 申请日: | 2017-06-06 |
公开(公告)号: | CN109313548B | 公开(公告)日: | 2023-05-26 |
发明(设计)人: | 艾瑞克·韦恩·马胡林;雅各布·帕维尔·戈拉布;卢西恩·科德雷斯库 | 申请(专利权)人: | 高通股份有限公司 |
主分类号: | G06F9/30 | 分类号: | G06F9/30;G06F9/38;G06F9/345;G06F12/00 |
代理公司: | 北京市金杜律师事务所 11256 | 代理人: | 王茂华 |
地址: | 美国加利*** | 国省代码: | 暂无信息 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 用于 执行 simd 收集 复制 操作 方法 设备 | ||
1.一种执行存储器操作的方法,所述方法包括:
通过处理器向事务输入缓冲器提供存储器的两个或更多个源地址;
由所述事务输入缓冲器向事务定序器提供所述两个或更多个源地址;
由所述事务定序器提供用于将来自所述两个或更多个源地址的两个或更多个数据元素复制到收集结果缓冲器中的指令;
响应于所述指令,将来自所述存储器中的所述两个或更多个源地址的所述两个或更多个数据元素复制到所述收集结果缓冲器;以及
使用单指令多数据SIMD加载操作来将所述两个或更多个数据元素从所述收集结果缓冲器加载到所述处理器中的向量寄存器。
2.根据权利要求1所述的方法,其中所述收集结果缓冲器定位于所述存储器中或非常接近于所述存储器。
3.根据权利要求1所述的方法,其中所述收集结果缓冲器是循环缓冲器。
4.根据权利要求1所述的方法,其中所述两个或更多个源地址在所述存储器中正交或非相依且非相连。
5.根据权利要求1所述的方法,其包括将所述两个或更多个数据元素乱序复制到所述收集结果缓冲器。
6.根据权利要求5所述的方法,其中将所述两个或更多个数据元素乱序复制到所述收集结果缓冲器涉及两个或更多个不同时延。
7.根据权利要求5所述的方法,其包括在未由所述处理器引导的情况下在背景模式下将所述两个或更多个数据元素乱序复制到所述收集结果缓冲器。
8.根据权利要求5所述的方法,其包括跟踪所述收集结果缓冲器并在所述收集结果缓冲器完成之后加载来自所述收集结果缓冲器的所述两个或更多个数据元素。
9.一种执行存储器操作的方法,所述方法包括:
通过处理器向事务输入缓冲器提供存储器的两个或更多个源地址和对应两个或更多个目标地址;
由所述向事务输入缓冲器向事务定序器提供所述两个或更多个源地址和所述对应两个或更多个目标地址;以及
执行由所述事务定序器提供的、用于将来自所述两个或更多个源地址的两个或更多个数据元素复制到所述存储器内的对应两个或更多个目标地址的两个或更多个指令,而不在中间复制到所述处理器中的寄存器。
10.根据权利要求9所述的方法,其中所述两个或更多个源地址正交或非相依且非相连。
11.根据权利要求9所述的方法,其中所述两个或更多个目标地址在所述存储器中正交或非相依且非相连。
12.根据权利要求9所述的方法,其中将来自所述两个或更多个源地址的两个或更多个数据元素复制到所述存储器内的对应两个或更多个目标地址包括执行单指令多数据SIMD复制指令。
13.根据权利要求12所述的方法,其包括在未由所述处理器引导的情况下在背景模式下执行所述SIMD复制指令。
14.一种用于执行存储器操作的设备,其包括:
处理器,其经配置以提供存储器的两个或更多个源地址;
事务输入缓冲器,其经配置以从所述处理器接收所述两个或更多个源地址;
事务定序器,其经配置以从所述事务输入缓冲器接收所述两个或更多个源地址,并且提供用于复制来自所述两个或更多个源地址的两个或更多个数据元素的指令;
收集结果缓冲器,其经配置以响应于所述指令,接收从所述存储器中的所述两个或更多个源地址复制的所述两个或更多个数据元素;以及
逻辑,其经配置以基于由所述处理器执行的单指令多数据SIMD加载操作而将来自所述收集结果缓冲器的所述两个或更多个数据元素加载到所述处理器中的向量寄存器。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于高通股份有限公司,未经高通股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201780035161.6/1.html,转载请声明来源钻瓜专利网。