[发明专利]支持标向量协同工作的向量SIMD运算结构在审

专利信息
申请号: 201510718729.7 申请日: 2015-10-29
公开(公告)号: CN105373367A 公开(公告)日: 2016-03-02
发明(设计)人: 陈书明;彭元喜;雷元武;万江华;郭阳;田甜;彭浩;徐恩 申请(专利权)人: 中国人民解放军国防科学技术大学
主分类号: G06F9/38 分类号: G06F9/38
代理公司: 湖南兆弘专利事务所 43008 代理人: 周长清
地址: 410073 湖南省长沙市砚瓦池正街47号中国*** 国省代码: 湖南;43
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 支持 向量 协同 工作 simd 运算 结构
【说明书】:

技术领域

发明主要涉及到微处理器结构与设计领域,特指一种支持标向量协同工作的向量SIMD 运算结构。

背景技术

数字信号处理器(DigitalSignalProcessor,DSP)作为一种典型的嵌入式微处理器被广泛 应用于嵌入式系统中,它以其数据处理能力强大、可编程性好、使用灵活和低功耗等特点, 给信号处理的发展带来了巨大机遇,其应用领域拓展到军事、经济发展的各个方面。在现代 通信、图像处理和雷达信号处理等应用领域,随着数据处理量加大,对计算精度和实时性要 求的增加,通常需要使用更高性能的微处理器进行处理。

区别于传统的CPU,DSP具有以下特点:(1)计算能力强,关注实时计算胜于关注控 制和事务处理;(2)对于典型信号处理设有专门硬件支持,如乘加运算、线性寻址;(3) 嵌入式微处理器的共性特征:地址和指令通路不多于32位,多数数据通路不多于32位;非 精确中断;短期离线调试、长期在线驻留运行的程序工作方式(而非通用CPU调试即运行的 方法);(4)集成外设接口以快速外设为主,特别利于在线收发高速AD/DA数据,也支持 DSP间高速直连。

通用科学计算需要高性能的DSP,然而传统DSP用于科学计算时有以下缺点:(1)位宽 小,使得计算精度和寻址空间不足。通用科学计算应用至少需要64位精度;(2)缺乏任务管 理、文件控制、进程调度、中断管理等软硬件支持,或者说缺乏操作系统硬件环境,给通用、 多道计算任务管理带来不便;(3)缺乏统一高级语言编程模式的支持,对多核、向量、数据 并行等的支持基本依靠汇编程序编程,不便于通用编程;(4)不支持本地宿主的程序调试模 式,仅依靠它机交叉调试仿真。这些问题严重限制了DSP在通用科学计算领域的应用。

有从业者提出了一种“通用计算数字信号处理器”(GPDSP),这是一种既保持嵌入式DSP 基本特征和高性能低功耗的优势,又高效支持通用科学计算的新型体系结构——多核微处理 器(GPDSP)。该结构能够克服一般DSP用于科学计算的上述问题,可同时提供对64位高性 能计算机和嵌入式高精度信号处理的高效支持。该结构具有如下特征:(1)具有双精度浮点 和64位定点数据的直接表示,通用寄存器、数据总线、指令位宽64位以上,地址总线40位 以上;(2)CPU与DSP异构多核紧密耦合,CPU核支持完整操作系统,DSP核的标量单元 支持操作系统微核;(3)考虑CPU核、DSP核及DSP核内向量阵列结构的统一编程模式;(4) 保持它机交叉仿真调试,同时提供本地CPU宿主调试模式;(5)保留除位数之外的普通DSP 的基本特征。

另有从业者提出一种“具有开关矩阵存储器的数据混洗单元”,其公开了一种数据混洗单 元实现结构及数据混洗方法,将程序中的混洗请求转化为开关矩阵存储器中的开关矩阵,从 而实现数据选择和重组。该混洗单元具有结构简单、灵活高效和任意节点混洗的特点。

GPDSP通常由多个同构64位处理单元组成处理阵列来获得较高浮点运算能力。然而, GPDSP使用众多处理单元开发通用科学计算并行性时还存在如下几个问题:(1)如何组织众 多同构处理单元,使其高效开发通用科学计算中的多个层次的并行性;(2)如何有效协调用 于控制的标量运算单元和用于计算的向量运算单元;(3)如何对通用科学计算中的矩阵类运 算提供支持,利用矩阵类运算中的大量数据复用特性来提高对众多同构处理单元的供数能力, 进而提高GPDSP的计算效率。

发明内容

本发明要解决的技术问题就在于:针对现有技术存在的技术问题,本发明提供一种能够 提高执行效率和并行性的支持标向量协同工作的向量SIMD运算结构。

为解决上述技术问题,本发明采用以下技术方案:

一种支持标向量协同工作的向量SIMD运算结构,其包括:

统一取指和指令派发部件,用来同时为标量处理单元SPU、向量处理单元VPU和向量阵 列存储器AM派发指令;

标量处理单元SPU,用来负责串行任务的处理,以及对向量处理单元VPU执行的控制;

向量处理单元VPU,用来负责计算密集的并行任务处理;

向量阵列存储器AM,用来为并行与多宽度的向量运算提供数据及搬移支持;

DMA单元,用来为标量处理单元SPU、向量处理单元VPU提供指令和数据。

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国人民解放军国防科学技术大学,未经中国人民解放军国防科学技术大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/201510718729.7/2.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top