[发明专利]一种卷积计算方法在审
申请号: | 201810101741.7 | 申请日: | 2018-02-01 |
公开(公告)号: | CN110110283A | 公开(公告)日: | 2019-08-09 |
发明(设计)人: | 林江南;冯雪林;孙刚;周一青;石晶林 | 申请(专利权)人: | 北京中科晶上科技股份有限公司 |
主分类号: | G06F17/15 | 分类号: | G06F17/15 |
代理公司: | 北京泛华伟业知识产权代理有限公司 11280 | 代理人: | 王勇;李科 |
地址: | 100190 *** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 卷积计算 数据段 运算效率 矢量 卷积 合并 | ||
1.一种卷积计算方法,该方法利用矢量DSP执行第一序列x和第二序列h的卷积计算,包括以下步骤:
步骤1:将所述第一序列x划分为多个数据段;
步骤2:将所划分的第一序列x的多个数据段分别与所述第二序列h执行卷积计算,以获得多个计算结果;
步骤3:合并所述多个计算结果,以获得所述第一序列x和第二序列h的卷积结果。
2.根据权利要求1所述的卷积计算方法,其中,步骤2包括:
步骤21:基于预定长度将所述第二序列h进行分组;
步骤22:将所述第一序列x的每一数据段进行分组;
步骤23:将所述第一序列x的每一数据段的各组与所述第二序列h的各组并行进行卷积计算。
3.根据权利要求2所述的卷积计算方法,其中,所述预定长度为2或3或4。
4.根据权利要求2所述的卷积计算方法,其中,所述第一序列x的各组包含的值的数量和所述第二序列h的各组包含的值的数量均为2。
5.根据权利要求4所述的卷积计算方法,其中,对于所述第一序列x的一组值{x0,x1}和所述第二序列h的一组值{h0,h1},通过以下子步骤执行一组卷积计算:
将{x0,x1}依次存储于所述矢量DSP的第一矢量寄存器,将{h0,h1}依次存储于所述矢量DSP的第二矢量寄存器;
执行{x0,x1}和{h0,h1}的卷积计算,获得计算结果y0=x0·h0,y2=x1·h1,y1=(x0+x1)·(h0+h1)-y0-y2;
将y0和y1依次存储于所述矢量DSP的第三矢量寄存器,将y1和y2依次存储于所述矢量DSP的第四矢量寄存器。
6.根据权利要求5所述的卷积计算方法,其中,对于所述第三矢量寄存器和所述第四矢量寄存器的多组卷积计算结果,将前一组卷积计算结果的最后一个值与后一组卷积计算结果的第一个值相加,并将相加结果存入被加数的位置,其它位置的计算结果保持不变。
7.根据权利要求1至6中任一项所述的卷积计算方法,其中,采用单指令多数据流对所述第一序列x的每一数据段并行进行访存或计算。
8.一种卷积计算装置,其特征在于包括:
矢量DSP,用于执行第一序列x和第二序列h的卷积计算;
数据分段单元,用于将所述第一序列x划分为多个数据段;
卷积计算单元,用于将所划分的第一序列x的多个数据段分别与所述第二序列h执行卷积计算,以获得多个计算结果;
卷积结果获取单元,用于合并所述多个计算结果,以获得所述第一序列x和第二序列h的卷积结果。
9.一种计算机可读存储介质,其上存储有计算机程序,其中,该程序被处理器执行时实现根据权利要求1至中任一项所述方法的步骤。
10.一种计算机设备,包括存储器和处理器,在所述存储器上存储有能够在处理器上运行的计算机程序,其特征在于,所述处理器执行所述程序时实现权利要求1至7中任一项所述的方法的步骤。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京中科晶上科技股份有限公司,未经北京中科晶上科技股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201810101741.7/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种特殊鞍点问题的处理方法
- 下一篇:一种平均数计算方法、装置及电子设备