[发明专利]一种基于并行加速循环体的性能语义加速机制及其应用在审
申请号: | 201910964789.5 | 申请日: | 2019-10-11 |
公开(公告)号: | CN110717587A | 公开(公告)日: | 2020-01-21 |
发明(设计)人: | 李险峰;王元洵 | 申请(专利权)人: | 北京大学深圳研究生院 |
主分类号: | G06N3/063 | 分类号: | G06N3/063;G06N20/00 |
代理公司: | 44248 深圳市科吉华烽知识产权事务所(普通合伙) | 代理人: | 胡吉科 |
地址: | 518000 广东省深圳*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 语义 加速机制 数据密集型 程序行为 技术改进 库调用 库函数 循环体 算法 调用 编译 并行 架构 抽象 查找 通用 观察 | ||
本发明适用于加速机制技术改进领域,提供了一种基于并行加速循环体的性能语义加速机制,所述性能语义加速机制包括:S1、观察计算和数据密集型的ML算法查找出其共同模式;S2、将找出的共同模式抽象成与性能相关的程序行为构成性能语义;S3、对性能语义进行加速形成通用加速机制。该性能语义加速机制通过调用其库函数来编写的算法,并且代码将被编译为硬件API进行库调用。简化了程序员每次都需要队ML算法的架构,节省了时间,提高了效率。
技术领域
本发明属于加速机制技术改进领域,尤其涉及一种基于并行加速循环体的性能语义加速机制及其应用。
背景技术
机器学习(ML)的日益普及及其非凡的计算需求共同引发了对ML应用的硬件加速器设计的广泛研究[1]。与通用架构相比,这些加速器在性能改进方面达到了1-2个数量级。在当前的智能手机中,用于神经网络加速的NPU协处理器已成为应用处理器的组成部分。然而,目前ML加速器仍然基于定制设计,这是昂贵的,费力的,并且最严重的是,具有非常有限的可重新定位性。实质上,只有具有巨大市场容量的ML算法才能通过定制设计为加速器付出努力,并且为每类ML算法设置专用加速器是不切实际的。
[1].V.Sze,Y.Chen,T.Yang and J.S.Emer,Efficient Processing of DeepNeural Networks:A Tutorial and Survey,in Proceedings of the IEEE,vol.105,no.12,pp.2295-2329,Dec.2017。
[2].Chen,Tianshi,et al.DianNao:a small-footprint high-throughputaccelerator for ubiquitous machine-learning.Acm Sigplan Notices49.4(2014):269-284。
[3].Luo,Tao,et al.DaDianNao:A Neural Network Supercomputer.IEEETransactions on Computers 66.1(2016):1-1。
[4].Liu,Daofu.PuDianNao:A Polyvalent Machine Learning Accelerator.Twentieth International Conference on Architectural Support for ProgrammingLanguages\&Operating Systems ACM,2015。
[5].Guo,Kaiyuan,et al.Software-Hardware Codesign for EfficientNeural Network Acceleration.IEEE Micro 37.2(2017):18-25。
[6].Yang,Yifan,et al.Synetgy:Algorithm-hardware Co-design forConvNet Accelerators on Embedded FPGAs.(2018)。
[7].Liu,Shaoli,et al.Cambricon:An Instruction Set Architecture forNeural Networks.2016ACM/IEEE 43rd Annual International Symposium on ComputerArchitecture(ISCA)IEEE Computer Society,2016。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京大学深圳研究生院,未经北京大学深圳研究生院许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910964789.5/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种深度神经网络的结构搜索方法及装置
- 下一篇:用于卷积运算的装置和方法