[发明专利]具有用于提供多模向量处理的可编程数据路径配置的向量处理引擎、以及相关向量处理器、系统和方法有效
申请号: | 201480012332.X | 申请日: | 2014-03-07 |
公开(公告)号: | CN105027109B | 公开(公告)日: | 2019-03-08 |
发明(设计)人: | R·汗 | 申请(专利权)人: | 高通股份有限公司 |
主分类号: | G06F15/78 | 分类号: | G06F15/78;G06F15/80 |
代理公司: | 上海专利商标事务所有限公司 31100 | 代理人: | 周敏 |
地址: | 美国加利*** | 国省代码: | 美国;US |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 向量处理 向量指令 数据路径配置 向量数据 可编程数据 向量处理器 路径配置 可编程 多模 引擎 数据路径 向量运算 重新编程 配置 | ||
本文所公开的实施例包括具有可编程数据路径配置的向量处理引擎(VPE)以供提供多模向量处理。还公开了相关的向量处理器、系统和方法。该VPE包括向量处理级,其被配置成根据该向量处理级中所执行的向量指令来处理向量数据。每个向量处理级包括各向量处理块,这些向量处理块各自被配置成基于正被执行的向量指令来处理向量数据。向量处理块能够基于数据路径配置来为不同类型的向量指令提供不同的向量运算。向量处理块的数据路径是可编程的,以可重新编程来根据正被执行的特定向量指令来不同地处理向量数据。以此方式,VPE可被提供其可编程以根据正被执行的向量指令基于数据路径配置来执行不同类型的功能的数据路径配置。
本申请涉及2013年3月13日提交的、名为“Vector Processing Engines HavingProgrammable Data Path Configurations For Providing Multi-Mode Radix-2XButterfly Vector Processing Circuits,And Related Vector Processors,Systems,And Methods(具有用于提供多模基-2X蝶形向量处理电路的可编程数据路径配置的向量处理引擎及相关向量处理器、系统和方法)”的美国专利申请S/N.13/798,599(高通编号No.123247),该申请通过引用被整体纳入于此。
本申请还涉及2013年3月13日提交的、名为“Vector Processing Carry-SaveAccumulators Employing Redundant Carry-Save Format To Reduce CarryPropagation,And Related Vector Processors,Systems,And Methods(采用冗余进位保留格式来减少进位传播的向量处理进位保留累加器及相关向量处理器、系统和方法)”的美国专利申请S/N.13/798,618(高通编号No.123248),该申请通过引用被整体纳入于此。
技术领域
本公开的领域涉及用于处理向量和标量运算的向量处理器和相关系统,包括单指令多数据(SIMD)处理器和多指令多数据(MIMD)处理器。
背景技术
无线计算系统正迅速成为数字信息领域中最流行的技术之一。技术进步已导致越来越小且越来越强大的无线通信设备。例如,无线计算设备通常包括小、轻量且易于由用户携带的便携式无线电话、个人数字助理(PDA)和寻呼设备。更具体地,便携式无线电话(诸如蜂窝电话和网际协议(IP)电话)可通过无线网络传输语音和数据分组。此外,许多这样的无线通信设备包括其它类型的设备。例如,无线电话可包括数码相机、数码摄像机、数字记录器、和/或音频文件播放器。同样,无线电话可包括可用于接入因特网的web接口。此外,无线通信设备可包括用于根据所设计的无线通信技术标准(例如,码分多址(CDMA)、宽带CDMA(WCDMA)以及长期演进(LTE))来处理高速无线通信数据的复杂处理资源。因此,这些无线通信设备包括相当强的计算能力。
随着无线计算设备变得越来越小且越来越强大,它们越来越变得资源受限。例如,屏幕尺寸、可用存储器和文件系统空间的量以及输入和输出能力的数量可能受到设备的小尺寸的限制。此外,电池大小、电池提供的电量以及电池的寿命也受到限制。增加设备的电池寿命的一种方式是设计消耗较少功率的处理器。
就这一点而言,对包括向量处理器的无线通信设备可采用基带处理器。向量处理器具有提供对向量(即,数组)工作的高级运算的向量体系结构。与对一组数据执行向量指令然后再次取回和解码向量指令以用于向量内的后续元素相反,向量处理涉及取回向量指令一次,然后在数据元素的整个数组上执行向量指令多次。这种过程允许降低执行程序所需的能量,因为每一向量指令需要被取回的次数较少等等。由于向量指令同时在多个时钟周期上对长向量操作,因此高度并行性可用简单的按次序向量指令分派来实现。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于高通股份有限公司,未经高通股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201480012332.X/2.html,转载请声明来源钻瓜专利网。