[发明专利]兼顾公平性的上下文感知学习的结果预测分类器在审
申请号: | 201810378883.8 | 申请日: | 2018-04-25 |
公开(公告)号: | CN108596255A | 公开(公告)日: | 2018-09-28 |
发明(设计)人: | 朱斐;刘晓飞;伏玉琛;钟珊 | 申请(专利权)人: | 苏州大学 |
主分类号: | G06K9/62 | 分类号: | G06K9/62;G06N99/00 |
代理公司: | 苏州翔远专利代理事务所(普通合伙) 32251 | 代理人: | 陆金星;姚惠菱 |
地址: | 215104 江苏*** | 国省代码: | 江苏;32 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 分类器 权重矩阵 上下文感知 结果预测 初始化 公平性 更新 分类步骤 分类样本 划分结果 满足条件 实际结果 随机选取 预测结果 预测 成功率 数据库 赌博 取出 反馈 学习 概率 失败 探索 | ||
本发明公开了一种兼顾公平性的上下文感知学习的结果预测分类器,分类器采用如下分类步骤:(1)初始化分类器的探索参数;(2)初始化分类器的权重矩阵;(3)判断数据库中是否有数据,如是,则随机选取其中一条数据的特征,转至步骤(4),如否,则结束训练;(4)根据选取赌博臂的概率取出分类样本;(5)根据权重矩阵预测结果;(6)接收实际结果的反馈,判断是否满足条件,如是,则预测失败,转至步骤(7),如否,则转至步骤(3);(7)更新分类器的权重矩阵。本发明分类器利用划分结果更新分类器,根据特征划分出类别,如划分错误,则进行分类器权重矩阵的更新,从而使分类器划分出的类别更准确了,使得预测成功率更高。
技术领域
本发明涉及数据分类领域,具体涉及一种兼顾公平性的上下文感知学习的结果预测分类器。
背景技术
目前,机器学习的很多方法已经应用到人们生活中的各领域,如各类决策系统等。但是,随着研究的不断深入,机器学习所存在的问题也开始显现,如使用机器学习方法的分类系统在欠缺公平性、无法及时感知所做决策的上下文环境等。因此,越来越多人开始关注机器学习中的公平性问题,以避免所做决策存在偏颇、有失公平性,导致结果不够准确。
决策问题可以通过分类算法进行建模、解决。如某个问题是从A、B、C、D中做决策,选择其中一项,则其过程可以建模为一个分类问题,目标类是A、B、C、D这4个类别,分类结果为这4个类中的一个,分类结果即为决策结果。
分类是机器学习的一类重要的研究领域。在机器学习领域,分类是指在已有数据的基础上学习到一个称之为分类器(Classifier)的函数或模型,该函数或模型能够把数据映射到给定类别中的一个或多个,从而可以应用于预测。分类器的构造和实施大致经过以下几个步骤:(1)选定样本(包含正样本和负样本),将所有样本分成训练样本和测试样本两部分;(2)在训练样本上执行分类器学习算法,生成分类模型;(3)在测试样本上执行分类,生成预测结果,计算评估指标,评价分类模型的性能;(4)根据分类的评估结果对分类器进行优化。
由于分类器是基于数据训练而生成的,因此,如果数据存在偏向性,则训练得到的分类器模型也会带有偏向性,造成所作出的决策自然也带有偏向性和不公平性。而在实际的环境中,由于各种因素,我们所采集到的数据不可避免的存在偏向性,由于这种偏向性的存在,学习分类器模型所使用的数据不能反映出真实环境的数据分布,这样就会导致所训练得到的分类器模型无法适用于真实环境中。故而,设计一种无论数据是否带有偏向性,模型本身能兼顾公平的分类器非常有现实价值。
在机器学习中,赌博机(bandit)是一类重要的模型,分单臂赌博机模型和多臂赌博机模型。在本发明中统称为赌博臂问题。赌博臂问题集中体现了在线学习及更宽泛的强化学习中一个核心的权衡问题:是应该探索(exploration)去尝试新的可能性,还是应该守成(exploitation),坚持目前已知的最好选择。赌博机问题模型是构成一系列动态的分配问题,智能体要通过取用赌博臂探索环境来获取有价值的信息,然后通过利用这些有价值的信息来增加总的奖赏值。本发明提供一种兼顾公平性的上下文感知学习的结果预测分类器,结合解决上下文赌博臂问题用到的探索与利用的方法来进一步改善预测效果,并设计一个具有公平性的赌博臂反馈分类器来应对预测过程中的不公平性。
发明内容
本发明的发明目的是提供一种兼顾公平性的上下文感知学习的结果预测分类器,结合解决上下文赌博机问题用到的探索与利用的方法来进一步预测效果,并设计一个具有公平性的赌博机反馈分类器来应对预测过程中的不公平性。
为实现上述发明目的,本发明提供以下的技术方案:一种兼顾公平性的上下文感知学习的结果预测分类器,
所述分类器通过有序的训练样本((X1,y1),...,(Xt-1,yt-1))进行t-1轮训练后得到映射ft-1,在第t轮训练时,分类器根据映射ft-1得出测试样本(Xt,yt)的预测值并且更新映射,分类器采用如下分类步骤:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于苏州大学,未经苏州大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201810378883.8/2.html,转载请声明来源钻瓜专利网。