[发明专利]一种综合双重联系的多视角信息瓶颈聚类算法在审
申请号: | 202111179830.1 | 申请日: | 2021-10-11 |
公开(公告)号: | CN113901921A | 公开(公告)日: | 2022-01-07 |
发明(设计)人: | 叶阳东;胡世哲 | 申请(专利权)人: | 郑州大学 |
主分类号: | G06K9/00 | 分类号: | G06K9/00;G06K9/62 |
代理公司: | 暂无信息 | 代理人: | 暂无信息 |
地址: | 450001 河南省郑*** | 国省代码: | 河南;41 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 综合 双重 联系 视角 信息 瓶颈 算法 | ||
1.一种综合双重联系的多视角信息瓶颈聚类算法,其特征在于,包括以下步骤:
S1、获取多视角文本、图像或视频数据χ={x1,x2,...,xn},n表示输入数据的数量;
S2、对多视角数据进行预处理,得到每个视角的联合概率分布表示其中,di表示第i个视角的特征维度,m表示视角的数量;
S3、采用信息瓶颈方法发现每个视角内部的个性化特征信息
S4、通过一种凝聚式方法学习一个多视角共享特征子空间来发现视角间的共性化特征信息Ys;
S5、整合各视角的个性化特征和视角间共性化特征信息Ys得到每个视角的局部聚类结果
S6、使用互信息度量各个局部聚类结果挖掘视角之间的密切的数据簇联系以得到最终的具有一致性的全局数据聚类结果T*。
2.按照权利要求1所述的综合双重联系的多视角信息瓶颈聚类算法,其特征在于,所述S2中预处理是指使用经典的词袋模型将所有输入的多视角数据标准化到联合概率分布其中,表示每个视角的特征,di表示第i个视角中数据样本的维度,m表示视角的数量。
3.按照权利要求1所述的综合双重联系的多视角信息瓶颈聚类算法,其特征在于,所述S3具体为:采用信息瓶颈方法,其目标函数表示为以发现每个视角内部的个性化特征信息其中,参数β用来平衡数据的压缩与保留。
4.按照权利要求1所述的综合双重联系的多视角信息瓶颈聚类算法,其特征在于,所述S4中的凝聚式方法具体为:首先将各个视角的特征表示层叠为Ya,并将其初始化为共享子空间特征表示Ys,即Ys←Ya,进而,计算各特征元素对之间的融合代价,表示为:
其中,KL代表Kullback-Liebler距离,接着,挑选代价最小的特征对进行融合,进而不断迭代以上过程,直到所融合后的特征维度达到预先设定的共享特征子空间的大小。
5.按照权利要求1所述的综合双重联系的多视角信息瓶颈聚类算法,其特征在于,所述S5具体为:引入一个调整参数γ以平衡各个视角内部的个性化特征与视角之间的共性化特征Ys对于局部聚类结果的贡献程度,具体表达为:
6.按照权利要求1所述的综合双重联系的多视角信息瓶颈聚类算法,其特征在于,所述S6具体为:采用标准化的互信息度量局部聚类结果中数据簇之间的密切联系,定义为:
其中,H(A)代表变量A的熵。依据该定义,输入局部聚类结果可以求得最终的全局聚类结果T*。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于郑州大学,未经郑州大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202111179830.1/1.html,转载请声明来源钻瓜专利网。
- 上一篇:用于电子蒸汽烟装置的个人携带盒
- 下一篇:一种海洋地质调查用岩土取样设备