[发明专利]一种基于ARM Cotex-A系列平台的人脸检测实现方法有效

申请号：	201810372936.5	申请日：	2018-04-24
公开（公告）号：	CN108764037B	公开（公告）日：	2021-12-24
发明（设计）人：	洪朝群;王善炮	申请（专利权）人：	石狮市森科智能科技有限公司
主分类号：	G06K9/00	分类号：	G06K9/00;G06T1/20;G06F8/41
代理公司：	北京科亿知识产权代理事务所(普通合伙) 11350	代理人：	汤东凤
地址：	362000 福建省泉州市石狮市***	国省代码：	福建;35
权利要求书：	查看更多	说明书：	查看更多
摘要：
搜索关键词：	一种基于 arm cotex 系列平台检测实现方法
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【权利要求书】：

1.一种基于ARM Cotex-A系列平台的人脸检测实现方法，其特征在于，包括如下步骤：

S1、在ARM Cotex-A系列处理器硬件环境下修改seetaface的FaceDetection中的源码，修改编译器类型为交叉编译器；

S2、在编译器设置中增加NEON的编译选项；

S3、替换FaceDetection中原有的SSE指令所需头文件为NEON所需头文件；

S4、针对FaceDetection的原代码中的使用SSE指令的部分修改为NEON指令，将使用SSE指令的函数修改为使用NEON的函数；

S5、在步骤S2中已增加NEON的编译选项支持下，重新编译程序，得到需要的动态链接库文件，从而编译得到在ARM Cotex-A系列处理器平台下支持NEON的FaceDetection程序；

步骤S1的具体操作为：

修改SET命令：

1)设置系统类型，选择使用linux：

SET(CMAKE_SYSTEM_NAME Linux)

2)设置交叉编译器路径：启用交叉编译器，并添加交叉编译器的路径：

SET(CMAKE_CXX_COMPILER/opt/hisi-linux/x86-arm/arm-hisiv400-linux/bin/arm-hisiv400-linux-gnueabi-g++)；

步骤S4的具体操作为：

将原有的SSE指令转换为arm指令集下的neon指令；

先在代码中替换原有使用SSE的代码；代码中使用了SSE指令的函数有如下几个：

_mm_add_epi32(__m128i a,__m128i b)——①；

_mm_sub_epi32(__m128i a,__m128i b)——②；

_mm_mullo_epi32(__m128i a,__m128i b)——③；

_mm_mul_ps(__m128i a,__m128i b)——④；

_mm_cmpgt_ps(__m128 a,__m128 b)——⑤；

_mm_set_epi32(int i3,int i2,int i1,int i0)——⑥；

其中：

_mm_add_epi32()函数的功能为一次完成4个32位整形数的相加，并返回相加结果，函数①的替换函数为：vaddq_s32(a,b)；vaddq_s32()的函数原型为int32x4_t vaddq_s32(int32x4_t__a,int32x4_t__b)；为arm指令集下的向量计算，功能与_mm_add_epi32()相同；

_mm_sub_epi32()函数的功能为一次完成4个32位整形数的相减，并返回相加结果，函数②的替换函数为：vsubq_s32(a,b)；vsubq_s32()的函数原型为int32x4_t vsubq_s32(int32x4_t__a,int32x4_t__b)；为arm指令集下的向量计算，功能与_mm_sub_epi32()相同；

_mm_mullo_epi32()函数的功能为一次完成4个32位整形数的相乘，并返回相加结果；函数③的替换函数为vmulq_s32(a,b)；vmulq_s32()的函数原型为int32x4_t vmulq_s32(int32x4_t__a,int32x4_t__b)；为arm指令集下的向量计算，功能与_mm_mullo_epi32()相同；

_mm_mul_ps()函数的功能为一次完成4个32位整形数的相乘，并返回相加结果；对于函数④，返回在一个__m128的寄存器，具体函数实现如下：

INLINE__m128_mm_mul_ps(__m128 a,__m128 b)

{

__m128 ret；

ret[0]＝a[0]*b[0]；

ret[1]＝a[1]*b[1]；

ret[2]＝a[2]*b[2]；

ret[3]＝a[3]*b[3]；

return ret；

}

_mm_cmpgt_ps()函数的功能为比较大于；函数⑤的替换函数为(__m128)vcleq_f32(a,b)；vcleq_f32()的函数原型为float32x4_tvcleq_f32(float32x4_t__a,float32x4_t__b)；为arm指令集下的向量计算，功能与_mm_cmple_ps()相同；

_mm_set_epi32()功能为设置4个有符号的32位整数值；函数⑥的替换函数为：vreinterpretq_m128i_s32(vld1q_s32(data))；

其中返回值的类型定义在宏定义中，如下所示：

#define_MM_SHUFFLE(z,y,x,w)((z6)|(y4)|(x2)|w)

#define vreinterpretq_m128 i_s32(x)\

(x)

#define vreinterpretq_m128i_u32(x)\

vreinterpretq_s32_u32(x)

#define vreinterpretq_s32_m128i(x)\

(x)。

下载完整专利技术内容需要扣除积分，VIP会员可以免费下载。

免登录下载普通用户下载升级VIP会员，免费下载

该专利技术资料仅供研究查看技术是否侵权等信息，商用须获得专利权人授权。该专利全部权利属于石狮市森科智能科技有限公司，未经石狮市森科智能科技有限公司许可，擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作，请联系【客服】