[发明专利]一种基于集成TSK模糊分类器的众包质量提升的方法有效

申请号：	202010039850.8	申请日：	2020-01-15
公开（公告）号：	CN111444937B	公开（公告）日：	2023-05-12
发明（设计）人：	蒋云良;张雄涛;胡文军;邬惠峰	申请（专利权）人：	湖州师范学院
主分类号：	G06F18/2413	分类号：	G06F18/2413;G06F18/214;G06F18/2337;G06N20/20
代理公司：	杭州中利知识产权代理事务所(普通合伙) 33301	代理人：	韩洪
地址：	313000 浙江***	国省代码：	浙江;33
权利要求书：	查看更多	说明书：	查看更多
摘要：
搜索关键词：	一种基于集成 tsk 模糊分类质量提升方法
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【权利要求书】：

1.一种基于集成TSK模糊分类器的众包质量提升的方法，其特征在于：依次包括以下步骤：

S1.利用含有标签噪音的两分类数据集构建多个TSK-noise-FC模糊子分类器，在挑选出的不含噪音数据的验证集上产生多个增强属性，从而生成增强验证集；

S2.利用经典的模糊聚类算法FCM算法对增强验证集进行聚类，形成含有标签的多代表点数据，记做数据字典，利用生成的数据字典，对含有标签噪音的数据进行快速矫正，对于每一个含噪音数据的众包数据，找到其最近的代表点，该代表点的标签就是预测的结果；

所述TSK-noise-FC模糊分类器所采用的算法1为：

a)算法1的输入：第l个训练子集对应的标签集其中x_i∈R^d,y_i∈{-1，+1,0},i＝1,2,…,N_l,模糊规则数K_l,参数ε＝(ε₁,ε₂,…,ε_N-M),ε_i＝ε,i＝1,2,…,N-M；

b)算法1的输出：模糊规则和子分类器的输出函数

c)算法1的学习过程如下：

c1)通过从集合{0,0.25,0.5,0.75,1}随机选择一个特征值，构造规则组合矩阵表示五个高斯函数中哪一个被选择；

c2)通过随机选择一个正数，构造核宽度矩阵

c3)根据规则组合矩阵和核宽度矩阵，构造每一条模糊规则的模糊隶属度，利用公式(1)计算，并且

其中j＝1,2,…,d,k＝1,2,…,K_l,归一化并构造矩阵X_g

第l个TSK-noise-FC TSK模糊分类器的前件参数可计算得出；

c4)根据公式(3)，计算后件参数a_g

其中α,β,γ是拉格朗日乘子，在公式(4)求得

其中，Q＝[q_ij]_{(2N-M)*(2N-M)}为核矩阵，

f＝(y,-ε,-ε),y＝(y₁,y₂,…,y_M),ε＝(ε₁,ε₂,…,ε_N-M),ε_i＝ε,i＝1,2,…,N-M

ζ＝(α₁,…,α_M,β_M+1,…,β_N,γ_M+1,…,γ_N)^T

c5)计算第l个TSK-noise-FCTSK模糊子分类器的输出

y_l＝X_ga_g (5)；

该方法所采用的算法2具体为：

a)算法2的输入：训练数据D_tr＝[X_tr Y_tr],验证数据D_v＝[X_v Y_v]，其中X_tr和X_v代表数据，Y_tr和Y_v代表标签，分类器个数L,K₁,K₂,…,K_L表示每一个子分类器的模糊规则数；

b)算法2的输出：代表性中心点及其标签；

c)算法2的训练过程：

c1)初始化

从两分类训练数据集D_tr中随机抽取各子分类器的训练子集D₁,D₂,…,D_L，并且D₁∪D₂∪……∪D_L＝D_tr，在对应标签Y₁,Y₂,…,Y_L中加入噪音标签，对于错误标签，翻转其对应的标签值，对于不确定的标签，其对应的标签值设置为0；

c2)以并行学习的方式学习第L个TSK-noise-FC模糊子分类器：

c2.1)为每一个子分类器指派模糊规则数，

c2.2)通过调用算法1，并行生成L个子分类器，

c2.3)输出L个子分类器的输出函数F₁(x),F₂(x),......,F_L(x)并将其值作为源数据的增强特征；

c3)生成增强验证数据集：

计算验证数据集的每一个样本的输出函数值F₁(x),F₂(x),......,F_L(x)，生成增强验证数据集其中表示源数据，X_v表示增强数据；

d)生成代表性中心点及其标签：

在增强验证数据集上调用FCM生成代表性中心点及其标签；

e)测试过程：

e1)对于含有噪音的众包数据，在代表性中心点上利用KNN对其标签进行快速矫正，

e2)输出矫正后的众包数据。

下载完整专利技术内容需要扣除积分，VIP会员可以免费下载。

免登录下载普通用户下载升级VIP会员，免费下载

该专利技术资料仅供研究查看技术是否侵权等信息，商用须获得专利权人授权。该专利全部权利属于湖州师范学院，未经湖州师范学院许可，擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作，请联系【客服】

本文链接：http://www.vipzhuanli.com/pat/books/202010039850.8/1.html，转载请声明来源钻瓜专利网。

同类专利

专利分类

G 物理

G06 计算；推算；计数
G06F 电数字数据处理

免登录下载普通用户下载升级VIP会员，免费下载

[发明专利]一种基于集成TSK模糊分类器的众包质量提升的方法有效

专利文献下载