[发明专利]基于样本风格特征的模糊超平面聚类方法及装置在审

专利信息
申请号: 202310658659.5 申请日: 2023-06-05
公开(公告)号: CN116662834A 公开(公告)日: 2023-08-29
发明(设计)人: 顾苏杭;朱培逸;鲁明丽;从金亮;丁卫 申请(专利权)人: 常熟理工学院
主分类号: G06F18/23 分类号: G06F18/23
代理公司: 北京中知法苑知识产权代理有限公司 11226 代理人: 李明;赵吉阳
地址: 215506 江*** 国省代码: 江苏;32
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 基于 样本 风格 特征 模糊 平面 方法 装置
【说明书】:

本公开实施例涉及机器学习领域,提供一种基于样本风格特征的模糊超平面聚类方法及装置,方法包括:建立保留样本的物理特征同时挖掘样本的风格特征的表征形式;基于表征形式和给定的数据集,建立基于物理特征和风格特征的模糊超平面聚类模型的初始目标函数;利用表征形式对应的正则化项和关于不同聚类中心的软间隔,对初始目标函数进行优化,得到更新后的目标函数;将更新后的目标函数的优化问题分解为基于表征形式的一系列子问题;基于一系列子问题确定更新后的目标函数的参数,求解出表征形式;基于求解出的表征形式对数据集中的样本进行聚类分析,得到数据集对应的预测类别标签集。本公开可有效识别聚类流形结构交叉情况下的不同聚类样本。

技术领域

本公开涉及机器学习技术领域,特别涉及一种基于样本风格特征的模糊超平面聚类方法及装置。

背景技术

随着人工智能技术的不断发展,聚类技术已广泛应用于数据挖掘、图像分析、人脸识别、市场行情分析、自然语言处理及语音识别等诸多领域。然而,由于样本的同源性,数据集中来自不同聚类的样本呈现各自不同的风格特征,例如,不同个体的书法呈现不同的手写体风格,正常人群呈现的脑电信号波形显著不同于癫痫患者的脑电信号波形,英文中的元音呈现各自独特的发音风格,等等。

样本的风格特征与样本的物理特征(如距离、颜色及纹理等)不同,能够提供更多的样本特征描述信息,十分有助于提升机器学习模型的识别性能。针对基于样本风格特征的机器学习算法,现有技术中已有相关研究成果,然而,现有的研究成果绝大多数集中于分类技术,仅有一者(文献Gu S.et al.,Fuzzy style k-plane clustering,IEEETransactions on Fuzzy Systems,2021,29(6):1518-1532)将聚类技术与样本风格特征相结合,提出一种模糊风格K平面聚类算法,以解决风格数据的聚类问题。然而,当不同聚类的样本呈现相近或相似的风格时,聚类流形结构会出现交叉情况,上述研究成果不能很好地识别交叉部分的不同聚类样本,导致有限的识别性能。另一方面,上述研究成果侧重于利用方阵作为风格矩阵以表征不同聚类样本的风格特征,不利于聚类分析过程中同时考虑样本的风格特征和物理特征。

发明内容

本公开旨在至少解决现有技术中存在的问题之一,提供一种基于样本风格特征的模糊超平面聚类方法及装置。

本公开的一个方面,提供了一种基于样本风格特征的模糊超平面聚类方法,所述聚类方法包括:

建立能够保留样本的物理特征并同时挖掘所述样本的风格特征的表征形式;

基于所述表征形式和给定的数据集,建立基于所述物理特征和所述风格特征的模糊超平面聚类模型的初始目标函数;其中,所述数据集的类型包括图像、文本、语音中的任意一者;

利用所述表征形式对应的正则化项和关于不同聚类中心的软间隔,对所述初始目标函数进行优化,得到更新后的目标函数;

将所述更新后的目标函数的优化问题分解为基于所述表征形式的一系列子问题;

基于所述一系列子问题,确定所述更新后的目标函数的参数,求解出所述表征形式;

基于求解出的所述表征形式,对所述数据集中的样本进行聚类分析,得到所述数据集对应的预测类别标签集。

可选地,所述表征形式采用风格超平面矩阵A,其中,A∈Rd×q,Rd×q表示取值为实数的d行q列的矩阵,d为A的纵轴方向维度,q为A的横轴方向维度,且qd;A的前d×d个元素组成单位矩阵,用于表征样本的所述物理特征;A的前d×d个元素之外的其他元素组成d×(q-d)维的矩阵,用于表征样本的所述风格特征。

可选地,所述初始目标函数表示为下式(1),所述初始目标函数的约束条件表示为下式(2):

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于常熟理工学院,未经常熟理工学院许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/202310658659.5/2.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top