[发明专利]一种基于ARM Cotex-A系列平台的人脸检测实现方法有效

专利信息
申请号: 201810372936.5 申请日: 2018-04-24
公开(公告)号: CN108764037B 公开(公告)日: 2021-12-24
发明(设计)人: 洪朝群;王善炮 申请(专利权)人: 石狮市森科智能科技有限公司
主分类号: G06K9/00 分类号: G06K9/00;G06T1/20;G06F8/41
代理公司: 北京科亿知识产权代理事务所(普通合伙) 11350 代理人: 汤东凤
地址: 362000 福建省泉州市石狮市*** 国省代码: 福建;35
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 一种 基于 arm cotex 系列 平台 检测 实现 方法
【权利要求书】:

1.一种基于ARM Cotex-A系列平台的人脸检测实现方法,其特征在于,包括如下步骤:

S1、在ARM Cotex-A系列处理器硬件环境下修改seetaface的FaceDetection中的源码,修改编译器类型为交叉编译器;

S2、在编译器设置中增加NEON的编译选项;

S3、替换FaceDetection中原有的SSE指令所需头文件为NEON所需头文件;

S4、针对FaceDetection的原代码中的使用SSE指令的部分修改为NEON指令,将使用SSE指令的函数修改为使用NEON的函数;

S5、在步骤S2中已增加NEON的编译选项支持下,重新编译程序,得到需要的动态链接库文件,从而编译得到在ARM Cotex-A系列处理器平台下支持NEON的FaceDetection程序;

步骤S1的具体操作为:

修改SET命令:

1)设置系统类型,选择使用linux:

SET(CMAKE_SYSTEM_NAME Linux)

2)设置交叉编译器路径:启用交叉编译器,并添加交叉编译器的路径:

SET(CMAKE_CXX_COMPILER/opt/hisi-linux/x86-arm/arm-hisiv400-linux/bin/arm-hisiv400-linux-gnueabi-g++);

步骤S4的具体操作为:

将原有的SSE指令转换为arm指令集下的neon指令;

先在代码中替换原有使用SSE的代码;代码中使用了SSE指令的函数有如下几个:

_mm_add_epi32(__m128i a,__m128i b)——①;

_mm_sub_epi32(__m128i a,__m128i b)——②;

_mm_mullo_epi32(__m128i a,__m128i b)——③;

_mm_mul_ps(__m128i a,__m128i b)——④;

_mm_cmpgt_ps(__m128 a,__m128 b)——⑤;

_mm_set_epi32(int i3,int i2,int i1,int i0)——⑥;

其中:

_mm_add_epi32()函数的功能为一次完成4个32位整形数的相加,并返回相加结果,函数①的替换函数为:vaddq_s32(a,b);vaddq_s32()的函数原型为int32x4_t vaddq_s32(int32x4_t__a,int32x4_t__b);为arm指令集下的向量计算,功能与_mm_add_epi32()相同;

_mm_sub_epi32()函数的功能为一次完成4个32位整形数的相减,并返回相加结果,函数②的替换函数为:vsubq_s32(a,b);vsubq_s32()的函数原型为int32x4_t vsubq_s32(int32x4_t__a,int32x4_t__b);为arm指令集下的向量计算,功能与_mm_sub_epi32()相同;

_mm_mullo_epi32()函数的功能为一次完成4个32位整形数的相乘,并返回相加结果;函数③的替换函数为vmulq_s32(a,b);vmulq_s32()的函数原型为int32x4_t vmulq_s32(int32x4_t__a,int32x4_t__b);为arm指令集下的向量计算,功能与_mm_mullo_epi32()相同;

_mm_mul_ps()函数的功能为一次完成4个32位整形数的相乘,并返回相加结果;对于函数④,返回在一个__m128的寄存器,具体函数实现如下:

INLINE__m128_mm_mul_ps(__m128 a,__m128 b)

{

__m128 ret;

ret[0]=a[0]*b[0];

ret[1]=a[1]*b[1];

ret[2]=a[2]*b[2];

ret[3]=a[3]*b[3];

return ret;

}

_mm_cmpgt_ps()函数的功能为比较大于;函数⑤的替换函数为(__m128)vcleq_f32(a,b);vcleq_f32()的函数原型为float32x4_tvcleq_f32(float32x4_t__a,float32x4_t__b);为arm指令集下的向量计算,功能与_mm_cmple_ps()相同;

_mm_set_epi32()功能为设置4个有符号的32位整数值;函数⑥的替换函数为:vreinterpretq_m128i_s32(vld1q_s32(data));

其中返回值的类型定义在宏定义中,如下所示:

#define_MM_SHUFFLE(z,y,x,w)((z6)|(y4)|(x2)|w)

#define vreinterpretq_m128 i_s32(x)\

(x)

#define vreinterpretq_m128i_u32(x)\

vreinterpretq_s32_u32(x)

#define vreinterpretq_s32_m128i(x)\

(x)。

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于石狮市森科智能科技有限公司,未经石狮市森科智能科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/201810372936.5/1.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top