[发明专利]一种基于HRTF-PSO-FCM的无人机侦察视觉信息可听化方法有效

申请号：	202010974728.X	申请日：	2020-09-16
公开（公告）号：	CN112101461B	公开（公告）日：	2022-02-25
发明（设计）人：	王松;胡燕祝;王子威	申请（专利权）人：	北京邮电大学
主分类号：	G06V20/17	分类号：	G06V20/17;G06V10/762;G06V10/774;G06K9/62;G10L25/57
代理公司：	暂无信息	代理人：	暂无信息
地址：	100876 ***	国省代码：	北京;11
权利要求书：	查看更多	说明书：	查看更多
摘要：
搜索关键词：	一种基于 hrtf pso fcm 无人机侦察视觉信息可听方法
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【说明书】：

本发明涉及基于HRTF‑PSO‑FCM的无人机侦察视觉信息可听化方法，是一种对无人机侦察方向的分布式视觉信息实现可听化的算法实现，属于目标追踪与机器学习领域，其特征在于采用如下步骤：(1)计算更新隶属度；(2)计算更新适应度；(3)更新每个粒子的速度；(4)更新每个粒子的位置；(5)进行灰度变换；(6)确定图像与声音的映射关系。本设计采用PSO‑FCM算法很好的将背景与信息主体相分离，极大加快主要信息的图像向声音的转换的过程，提高系统效率，促进实时性转换。采用声音的频率、响度和音长特征进行编码，有利于将图像信息的多维空间信息进行表示，提高图像信息转化为声音信息的辨识能力。

技术领域

本发明涉及目标追踪与机器学习领域，主要是一种对无人机侦察方向的分布式视觉信息实现可听化的算法实现。

背景技术

目标追踪就是利用机器拍摄到的视觉信息，进行图像处理，从而获取目标的关键信息进行标记。除此之外，将追踪到的目标图像转换为声音信息，可以很好的解决图像立体感知的问题。传统的图像可听化方法大多基于像素方法，这种方法保留重要的视觉特征，但是由于图像处理的数据比较大，降维的过程中不可避免的丢失了大量重要的视觉特征，识别效果受到一定影响，同时随着计算量的增大，系统消耗时间延长，空间复杂度繁杂。所以，传统的视觉信息向声音信息的转换，在实时性方面有一定的困难，并且由于大量重要的视觉特征的丢失，一些重要的信息丢失的现象常常存在。

对于以上的问题，拟提出一种基于HRTF-PSO-FCM的无人机侦察视觉信息可听化方法。使用基于粒子群的模糊C均值聚类算法的图像分割算法，一方面，算法收敛速度快，设置参数量较少，提高算法的实时性效果。另一方面，算法避免了易局部最优的缺陷。算法使用HRTF与声音参数变化相结合方法进行视觉信息的可听化，利用声音的频率、响度和音长特征进行编码，有利于将图像信息的多维空间信息进行表示，提高图像信息转化为声音信息的辨识能力。为了提高目标追踪领域以及相关领域中视觉信息可听化的效果，准确实时的完成可听化尤为关键，本设计提出的基于HRTF-PSO-FCM的无人机侦察视觉信息可听化方法，大大提高了图像转化为听觉信息的准确性和可辨识度，提高人对图像转化成声音的识别效率，具有一定的实用价值。

发明内容

针对上述现有技术中存在的问题，本发明要解决的技术问题是提供一种基于HRTF-PSO-FCM的无人机侦察视觉信息可听化方法，其具体流程如图1所示。

技术方案实施步骤如下：

(1)计算更新隶属度u_ik：

首先，初始化各项参数，包括惯性权重w，群体规模N，学习因子c₁和c₂，个体极值P_best,i，全局极值G_best，模糊指数m，聚类数目c，最小迭代误差ε，最大迭代次数T_max，令当前迭代次数t＝0。

式中，i为第i个粒子，k为第k类，d_ik为样本点x_i距离聚类中心的欧氏距离。

(2)计算更新适应度f(x_i)：

式中，k为常数，J_m(U,V)为聚类的目标函数，U表示原矩阵，V表示聚类中心。其中，当J_m(U,V)达到最小值时，个体适应度具有最大值。

若计算得到的适应度大于P_best,i，则更新P_best,i。若大于G_best的适应度，则更新G_best。

(3)更新每个粒子的速度V_i(t+1)：

下载完整专利技术内容需要扣除积分，VIP会员可以免费下载。

免登录下载普通用户下载升级VIP会员，免费下载