[发明专利]一种适合向量处理的多核软件架构的实现方法及装置有效

专利信息
申请号: 201910968775.0 申请日: 2019-10-12
公开(公告)号: CN110704193B 公开(公告)日: 2022-12-16
发明(设计)人: 方志红;郭怡冉;肖晶;竺红伟;顾庆远;梁之勇;邓海涛;陈凯;陈仁元 申请(专利权)人: 中国电子科技集团公司第三十八研究所
主分类号: G06F9/50 分类号: G06F9/50;G06F17/16;G06F17/15
代理公司: 合肥市浩智运专利代理事务所(普通合伙) 34124 代理人: 丁瑞瑞
地址: 230000 安徽省合*** 国省代码: 安徽;34
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 一种 适合 向量 处理 多核 软件 架构 实现 方法 装置
【说明书】:

本发明公开了一种适合向量处理的多核软件架构的实现方法及装置,所述方法包括:将输入向量按照处理核的数量均分为若干个待处理子向量,每个处理核处理其中一个待处理子向量;对于具有相同形参,形参相同,处理核间交互方式相同,输出向量切分方式相同的函数运算归为同一函数类,建立一个函数模板,所有函数模板构成一个函数模板集;然后每个处理核对其对应的待处理子向量进行处理时,从函数模板集中调用待处理子向量对应的函数模板,再将函数模板中的函数指针的输入参数赋值到该待处理子向量的子向量之间需要进行的函数运算;本发明的优点在于:本发明提供的多核软件架构用户可自主实现,简单高效。

技术领域

本发明涉及多核负载均衡领域,更具体涉及一种适合向量处理的多核软件架构的实现方法及装置。

背景技术

由于温度、制程、功耗等多方面约束,处理器单核频率提升日益困难。为了提高处理器性能,多核技术逐渐成为数字信号处理器更新迭代的主流趋势。多核技术的瓶颈在于应用优化。如何将应用任务分配到处理器内部各核,充分发挥各核处理性能成为多核软件优化的重点。

将任务均衡的分配到多个处理内核,是发挥多核处理器优势的关键,多核并行处理的研究具有十分重要的应用价值与广阔的应用前景。将串行处理转并行处理常用的方法有多线程操作系统(例如Linux的POSIX Thread)和并行开发环境(例和OPENMP开发环境)。多线程操作系统的一个进程中可包括多个线程,每个线程并行执行不同的任务;并行开发环境一般由用户在源码中对需要并行处理部分添加并行标识符,编译器根据标识符完成并行化操作。中国专利公开号CN101631139A,公开了基于多核平台的负载均衡软件架构及方法,其主要是采用多核平台和负载均衡设备作为架构元件,并为负载均衡设备上的每个网卡初始化一个内核线程,作为该网卡的软中断例程,各自处理所对应网卡的输入和输出,同时将所有内核线程独立化;为每两个网卡线程之间的信息交换建立一个独立的通道,每个通道中建立一组双向环形队列作为多核平台和负载均衡设备的联结器;环形队列维护一个写指针和一个读指针,分别由两个线程操作,使线程间消息交换无需加锁;在网卡输入的软中断例程中实现服务器负载均衡的选路策略,并在链路层执行应用层的所有工作。该发明的优点是实现了服务器的负载均衡,它能够显著地提高负载均衡设备的性能。但是该发明采用线程操作,需要操作系统支持,采用网卡进行输入输出控制,需要额外硬件支持。依赖于操作系统与并行开发环境的并行化处理一般由芯片厂商提供底层软件支持。如果芯片厂商实力不足以提供支持或得不到相关操作系统或开发环境的授权,用户很难自主实现。

发明内容

本发明所要解决的技术问题在于如何提供一种独立于操作系统与硬件之外的,用户能够自主实现的多核软件架构的实现方法及装置。

本发明通过以下技术手段实现解决上述技术问题的:一种适合向量处理的多核软件架构的实现方法,所述方法包括:将输入向量按照处理核的数量均分为若干个待处理子向量,每个处理核处理其中一个待处理子向量,当输入向量的长度无法被处理核的数量整除时,由指定的处理核处理余数部分对应的待处理子向量;

预先将形参相同,处理核间交互方式相同,输出向量切分方式相同的函数运算归为同一函数类,并建立针对所述函数类的函数模板,进而得到由函数模板构成的函数模板集,其中,所述函数运算为输入向量中包括的待处理子向量的运算;

然后每个处理核对其对应的待处理子向量进行处理时,从函数模板集中调用待处理子向量对应的函数模板,再将函数模板中的函数指针的输入参数赋值到该待处理子向量的子向量之间需要进行的函数运算。

本发明将向量型并行计算与多核芯片相结合,先进行向量任务分割,将向量均分,从而实现均衡负载,然后将具有相同处理流程的函数归为一类建立函数模板,众多函数模板再生成函数模板集,进行多核处理时,每个处理核只需要调用其对应的待处理子向量的函数模板,不需要重复编译处理流程相似的代码,减少重复性工作,提高效率,降低错误率,便于后期维护。且本发明的多核处理流程只要在C语言环境下运行函数模板集即可,不依赖于操作系统以及并行开发环境,独立于操作系统与硬件之外,可由用户自主实现。

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国电子科技集团公司第三十八研究所,未经中国电子科技集团公司第三十八研究所许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/201910968775.0/2.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top