[发明专利]一种用于人工智能加速的处理器微架构及其指令集组合应用方法在审
申请号: | 201910304828.9 | 申请日: | 2019-04-16 |
公开(公告)号: | CN111832722A | 公开(公告)日: | 2020-10-27 |
发明(设计)人: | 伍世聪;林森;李珏 | 申请(专利权)人: | 北京芯启科技有限公司 |
主分类号: | G06N3/08 | 分类号: | G06N3/08;G06N3/06 |
代理公司: | 北京名华博信知识产权代理有限公司 11453 | 代理人: | 李冬梅;苗源 |
地址: | 100091 北京市海淀*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 用于 人工智能 加速 处理器 架构 及其 指令 组合 应用 方法 | ||
1.一种用于特定领域计算加速的处理器微架构,其特征包括:
专门设计的译码装置,支持专门为加速设计的迭代及合并指令;
专门设计的执行装置,可以根据指令译码自动改变硬件计算类型、工作模式,并自动完成较为复杂的控制过程。
2.一套用于特定领域计算加速的指令集组合应用方法,其特征包括:
提取和定义了特定领域计算任务的通用类型、计算工作模式;
将操作类型和工作模式进行抽象、编码并封装成为特别设计的指令;
将这些指令以一定的数学规律组合,能加速完成较为复杂的计算任务,
同时大大压缩了指令需要的存储空间。
3.本发明能够通过对处理器微架构的微小调整满足扩展的设计,其特征包括:
不限单指令所包含的操作数的个数;
不限定操作数的来源,例如一般或特殊寄存器、缓存或其他装置;
不限定单指令所包含的操作类型或类型的数目;
不限定迭代次数
不限定合并输入的数据带宽。
4.所述专门设计的执行装置中,合并装置也不限定操作顺序,而是根据指令可以重构。
5.所述专门设计的执行装置中,合并装置也不限定操作节点所构成的拓补网络,根据指令可重构。
6.本发明提供一套对数学计算任务的自动编译器设计,其特征包括:
将数学计算任务根据精度展开(formula generator),转化为图(transform tographic),然后在图上优化、融合(opt imize),然后根据功耗、性能的不同偏重选择一个图(fi lter),最后将图转化为指令组合,完成从数学任务到指令的自动编译。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京芯启科技有限公司,未经北京芯启科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910304828.9/1.html,转载请声明来源钻瓜专利网。